“目前我国算力总规模位居全球第二位,近五年保持30%左右的年增长率,新增算力设施中智能算力占比过半,成为算力增长的新引擎。”在9月6日的2023中国国际服务贸易交易会“算力服务高质量发展论坛”上,工业和信息化部新闻宣传中心总编辑王保平提到这样一组数据。

  2022年底,ChatGPT的横空出世掀起一波席卷全球的大模型浪潮,这种强劲的需求瞬间传导至上游,押中智能算力的宝,“卖铲人”英伟达赚得盆满钵满。而随着AIGC、大模型等新应用、新业态不断涌现,算力发展也将迎来更大的历史机遇。

  新一轮超级周期

  “从整个产业来看,受益于智能算力、ChatGPT新趋势影响,AI正式开始新一轮科技的超级周期。”论坛上,联通数字科技有限公司云计算事业部副总经理丁鼎作出判断。

  他给这次AI大周期的新特点概括出“三个少见”:少见的渗透速率快、少见的高门槛以及少见的底层技术架构还可能会产生大幅波动的技术周期。

  新一轮科技超级周期也给底层的算力技术带来新一轮挑战。联想集团副总裁、中国区首席市场官王传东提到,过去算力增长遵循摩尔定律,每18个月性能会提升一倍,但到了智算时代,算力翻倍的时间已缩短至3-4个月。

  阿里云智能解决方案首席架构师郑海超也提到,大模型带来的算力需求为每两年275倍的增长,当下单个芯片已不再是衡量算力的基本单位,算力基本供给形式已经变成算力集群。

  算力一般分为通用算力、智能算力和超算算力三部分,大模型浪潮下被反复提及的GPU就是智能算力。

  OpenAI创始人Sam Altman曾公开表示,现在最大的问题是受限于GPU短缺和算力不足,产品的速度和可靠性都跟不上。国内市场上,英伟达中国特供版A800和H800 GPU也一度面临“哄抢”,价格疯涨。

  在接受北京商报记者采访时,郑海超提到,算力有很多种,即便是做人工智能的算力,也有GPU、TPU、NPU等区别,但其中占据绝对主力的为GPU。另一方面,人工智能的算力分为训练和推理两部分,我们当下所说的缺算力,其实缺的是高端GPU。人工智能所需的长时间训练过程,意味着低端GPU的性能无法满足需要,而且性价比也很低。

  “千行百业的必答题”

  算力常被形容为数字经济的“水电煤”,是推动各行各业数字化转型的重要基础设施。中国信通院发布的《中国算力服务研究报告(2023年)》显示,我国各省份算力服务发展指数与其数字经济规模呈显著正相关关系。

  据测算,单位算力服务发展指数提升可带来6400元的人均数字经济产出增长,以及566.4亿元数字经济规模的增长。“算力产业已成为各国科技战略布局的焦点之一,有望崛起为国家数字经济建设蓝图中的又一个超级赛道”,王保平称。

  算力应用场景也可分为通用计算场景、智算场景和超算场景。通用计算场景包括政务平台、智慧教育、电商平台等;超算场景包括气象预报、地震预测、药物研发、工程设计与计算等;而智算场景则囊括千万级到千亿级参数规模的诸多场景,其中大模型就是千亿级规模参数下衍生的具体应用。

  王传东提到,未来智算场景会有非常大的突破空间,有一天真正实现人机共生时,就完全是在智算的大环境下让人和机器或者人脑和智算同步运行。“此时,每个行业都面临着场景转换,所以智算中心建设已经成为千行百业的必答题。”

  中国移动(96.300, 0.25, 0.26%)云能力中心副总经理娄涛也提到,目前通用算力比例约为70%。预计到2030年,智算比例将达70%,“智算增长非常快,特别是ChatGPT的出现,导致其出现爆炸式增长”。

  统计数据显示,截至2021年底,全国在用超大型、大型数据中心超过450个,智算中心超过20个。2012-2021年,我国数字经济规模从11万亿元增长到超45万亿元,数字经济占GDP比重由21.6%提升至39.8%。

  破解供需矛盾

  算力发展未来可期,但目前仍面临现实困境,首当其冲的就是供需矛盾。沐曦是一家国产高性能GPU初创公司,论坛上,沐曦副总裁艾俊波提到,2010-2025年,全球各种各样的数据呈现出指数级增长,实时数据占比会越来越多,数据种类也更加多元,芯片算力的增长已满足不了更多应用的增长,“算力供需矛盾非常突出”。

  这种供需方面的矛盾还体现在各个层面。中国工程院院士高文曾提到,好的算力网需要迎接诸多技术挑战。第一个挑战是连接挑战,具体涉及连接延迟和超宽带宽问题;第二个挑战是调度,对于算力来讲,很重要的一点是和调度关联的能力能不能与相位对上,或者能不能在需要的时候上,不需要的时候别上。

  天翼云科技有限公司副总经理黄洪波也提到调度问题。据介绍,面对我国算力分布不均匀、供需不匹配的问题,天翼云自研算力分发网络平台“息壤”解决算力调度问题,并成功入选2022年国资央企超级十大工程。而在“息壤”的助力下,宁夏已上线全国首个算力交易调度平台,助力区域算力互联互通。

  2022年2月,“东数西算”工程正式启动。而实施“东数西算”工程的目的,便在于实现东西算力的均衡布局,优化算力成本,推动数据中心绿色低碳发展。

  数据显示,2022年西部国家算力枢纽新建数据中心规模超过60万标准机架,规模同比翻一番,占全国新建数据中心规模的45%,西部地区对东部地区数据计算需求的支撑作用越发明显。

  此外,黄洪波提到:“虽然我国算力总规模已经在世界上排名第二,但在一些关键核心技术方面,还存在一些差距。如何利用算力升级加速数字中国的发展也是我们面临的很大挑战。”

  北京商报记者 杨月涵

  百川智能追赶大模型

  作为后来者,百川智能以产品快速迭代的形式换时间。9月6日,百川智能发布了baichuan-7B 和baichuan-13B大模型的升级版。以百川智能CEO的身份入局大模型赛道之后,王小川差不多一个月发布一款大模型产品,既有开源的也有闭源的。如同iOS与安卓一样,未来大模型生态大概率会开源闭源并存,百川智能也没有拘泥于一种技术处置方式。但在客户选择上,百川智能更偏向B(企业)端。对于创业公司而言,这更像一种默契,绕过了场景尴尬,缩短了变现时间。

  9月6日,百川智能正式开源4款微调后的版本,均为免费可商用。

  百川智能成立于2023年4月10日,6月中旬开始对外发布大模型产品,包括Baichuan-7B、Baichuan-13B两款开源免费可商用的中文大模型,以及一款搜索增强大模型Baichuan-53B,目前两款开源大模型下载量已超过500万次。

  现场,王小川展示了百川大模型在安全、代码、数字计算、推理和语义相关的能力,强调了开源对学术研究等方面的作用。

  站在行业的角度,负责技术业务的APUS副总裁邓小波向北京商报记者解读了开源和闭源区别,“开源、闭源是对技术的处置方式,跟客户场景没有直接相关的联系”。

  尽管当日的主题围绕着开源,但王小川并不纠结于开源闭源,他认为,“这不是竞争关系,而是不同产品间的互补关系”。对于服务对象,王小川也很明确,这些大模型不是定位为to C(用户)的沙盒型产品,本质上更多是to B服务。

  不止王小川,越来越多的从业者都在强调自己在企业级市场的能力。前一天,把企业级的千帆大模型平台升级到2.0版本的百度智能云,就是最新的例子。在大模型发布现场,百川智能与腾讯云、阿里云、火山方舟、华为、联发科等达成合作,可以被理解为隔空秀肌肉。

  在文渊智库创始人王超看来,to B是变现难易程度决定的。不久前,一批大模型产品通过《生成式人工智能服务管理暂行办法》备案,正式向公众提供服务,百川大模型、文心一言等位列其中。

  谈到开放后会否to C收费,文心一言相关人士告诉北京商报记者,“目前不会的”。

  “如果直接面向用户,很难有人为大模型买单。”王超向北京商报记者表示,“做大模型的创业公司没有接触用户的渠道,也没有负担大量免费用户的能力,to B会相对容易些。以B端客户为主要服务对象,是所有创业公司大模型的出路”。

  按照王小川构想的B端大模型商业模式愿景,“B端带有天然真实场景,有中间层做企业服务,也有做大模型的公司。”

  北京商报记者 魏蔚