中美大模型竞逐中的中国科技力量

作者:曹钟雄

时间:2023-09-09 15:40

4822

QQ截图20231030155002.png

大模型已经成为当前人工智能、乃至新一轮科技革命与产业变革的核心驱动力,成为各大国争相抢占的科技制高点。“一切皆计算”大模型的浪潮下,全球企业也正加速“科技赶海”。我国数字科技领军企业大模型悉数登场,近日随着腾讯混元大模型的推出,大模型的“中国拉力赛”进入新赛段。国产大模型呈现“百家争鸣”态势,以高水平科技自立自强的创新使命,成为加速追赶的主力军。大模型的中美竞逐,短期看数量,中期看技术,长期看场景,如何通过场景构建具有全球竞争力的产业生态成为未来竞争焦点。

一、中美科技企业加速大模型角逐

科技变革的新赛道。自ChatGPT推出以来,全球科技企业纷纷下场,投身这一科技新赛道。人工智能似乎被ChatGPT打开了应用的缺口,让全球看到了新未来。比尔盖茨将ChatGPT定义为1980年以来最具革命性的科技进步。马化腾提到“最开始以为这是互联网十年不遇的机会,但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇”。人工智能在不远的将来可以让任何一家公司都需要具备驾驭数字技术的能力。

大模型的新生态。大模型通过使用前所未有的计算能力,集聚、重塑经济和产业的新生态。在大模型驱动下,千行百业的数字化转型几乎可以重新做一遍,产业生态也将随之重新架构。未来,以大模型为驱动,大、小模型与实体经济加速数实融合,将形成数字经济产业链供应链新生态。

拥挤着的中美企业。因为重要,所以拥挤,谁都不想错过这一机遇,大模型浪潮下的全球企业正在进行一场“科技赶海”。OpenAI、微软、谷歌、马斯克的人工智能公司xAI等诸多美国头部科技企业均在加大对大模型的投入,微软开发大模型供其他商业公司使用,Google旨在通过开发大模型提高自身业务(Google 广告、云服务等)的盈利能力。根据不完全统计,目前我国10亿参数规模以上的大模型近百个,呈现出“百团大战”格局。截至目前,已有11家大模型完成《生成式人工智能服务管理暂行办法》,向全社会开放使用。根据科技部新一代人工智能发展研究中心发布《中国人工智能大模型地图研究报告》,在大模型领域中国和美国大幅领先,大模型数量超过全球总数的80%。全球大模型竞逐,究其根本成为中美数字科技实力的竞赛。

二、从自立自强看中国大模型的创新

自研的自觉。ChatGPT的出现,让很多科技企业惊诧不已,都在思考如何追赶、如何发展自己的大模型。不少头部企业的高管们均在公开场合不同程度地表达过对生成式人工智能的憧憬,并积极投入到中国大模型的发展大潮之中。不像过去我们简单地引进、吸收、消化再创新的“学习式、模仿式发展”。在一定程度上来说,大模型创新,全球处于同一起跑线,或者至少同时置身于这个赛道。更重要的是,有形的产品,很容易“照葫芦画瓢”,引进、吸收,再模仿,但大模型既看不见又摸不着,需要在算法、架构、语料库的建设等进行研发,对我国企业自研的底层能力和战略定力都提出了非常高的要求。

创新的坚持。大模型是新型基础设施的关键底座之一,大模型的竞争也是国家科技战略的竞争。我国科技企业坚持创新和研发投入,持续强化语料库、模型算法、机器学习、算力设施等自研,逐步实现技术的自立自主。华为盘古大模型从核心底层进行架构,构建了以鲲鹏和昇腾为基础的 AI 算力云平台,在模型本身的创新,还从AI 的各项根技术创新,异构计算架构 CANN、昇思 MindSpore 等,为大模型开发和运行提供分布式并行加速,算子和编译优化、集群级通信优化等关键能力。近期,腾讯混元大模型更是从模型算法、机器学习框架、算力集群、向量数据库等多个关键基础设施进行全链路自主研发。可以说,从华为盘古大模型到腾讯混元大模型,都在加速追赶中取得了较好的成绩。

QQ截图20231030155047.png

三、从应用场景看中国大模型的突围

场景弯道超车。总体来看,虽然我国大模型发展还处于跟随状态,但与通用大模型不同,中国的大模型更关注应用和场景。我国的大模型大多基于不同行业和领域进行布局,从中国市场出发,切入行业应用进行数实融合,找到大模型的发展空间。我国企业在大模型上并没有一味的去追求大而全、不计成本的通用大模型,而是结合我国企业实际需求,在实体经济、制造业等行业领域进行切入。我国大模型进入通过场景需求驱动的快车道,有望在“小而美”场景领域实现弯道超车。

场景即应用。场景也是生产力,很多人把算力、算法和大数据作为大模型的三大关键,其实,在这三要素基础上,应该还要加上场景。只有能够适配持续动态变化的应用场景,才能实现人工智能的实际应用,才能服务于经济和产业发展。这恰恰是中国数字科技企业所擅长的,比如,腾讯就强调大模型要务实创新,专注打好基础,着重行业运用,把应用场景作为决胜的关键因素。这正是“以场景来架构大模型,以场景来训练大模型”的中国路径。

四、中美大模型的决胜在产业生态

1.美国:高性能下,场景缺失。诚然,美国大模型在强大的芯片、算力、算法,以及资本等支撑下,以高性能、通用的大模型取得先行一步的优势,但随着深入到应用层面,美国大模型的局限性也逐步显现。科技巨头推出的大模型不但没能赚到钱,反而成了碎钞机。以ChatGPT为例,OpenAI 2022年整体亏损翻倍至5.4亿美元,而当年收入只有3000万美元,它每天运行成本却高达70万美元。这也是OpenAI四处找客户的原因,包括2023 OpenAI年收购一家名叫Global Illumination的游戏公司“找应用场景”。

2.中国:务实管用下,市场驱动。中国企业在推进大模型中则更加务实,一开始就将市场需求作为研发的重要因素。“实用级”的大模型不仅在简单任务上表现优秀,而且能够应对复杂信息处理,为客户和用户带来实际价值。文心一言面向搜索和工作场景逐步开放,讯飞星火正在推进金融垂直领域的应用,腾讯混元大模型则把自己定位为行业底座,客既可以基于混元,又可以基于开源模型做第三方专属的行业大模型。中国的优势是产业链丰富、应用场景大、社会需求多元,给大模型在垂直领域拓展找了发展机会。同时,大模型通过不断迭代,形成行业大模型解决方案,在千行百业中扮演“行业大脑”的作用,实现由人驱动,走向由人和机器协同驱动产业高质量发展的重大跃升。

3.中美大模型的竞逐:终究在产业生态。当前,全球在大模型角逐基本形成了中美两大集群,各有优势,但决定大模型竞争力的不仅仅需要AI强,更需要大模型更快地转化成为可见的商业能力强。大模型要切实地投入到城市治理、智能制造、金融科技、生物医药、科学研究、文化娱乐等领域,形成专业的企业和组织生态,加速其在实体产业落地,并以此构建具有全球竞争力的大模型产业生态,实现真正意义上的大规模服务社会。

五、在更高水平上构建中国大模型生态

近日,国内多家大模型已通过生成式人工智能服务管理暂行办法的备案,正式向公众开放服务。腾讯混元大模型的亮相,头部企业已悉数登场,标志着我国主要科技企业的大模型“中国拉力赛”进入新赛段。大模型的推出只是开始,形成切实的市场能力,以及构建具有全球竞争力的大模型产业生态还需要很长一段路要走。在人工智能领域的高水平科技自立自强,在于构建起基于自研的算力算法核心技术、算力关键设施、大模型场景生态,才能把技术、市场和生态把牢牢掌握在自己手里。

1.算力算法重构。在大模型的关键领域、关键系统,加大自主创新,探索中国科技大模型的研发路径,增强自身研发能力和科技水平,防范建成后运用阶段出现“二次卡脖子”。强化处理器、服务器、控制器、存储器、核心芯片、基础架构软件、操作系统、分析软件等算力系统关键零部件和软件系统的研发和生产能力。加强语料库建设,丰富行业语料库,并形成机器学习能力,让大模型成为“行家里手”。形成从大模型到算力设施、关键零部件、核心算法等自主研发创新共同体,持续推出新设施、新技术、新工具。

2.场景生态重构。将大模型的触角渗透到经济和产业的细胞单元,用算力算法改变中国产业基因,驱动产业创新与经济转型,为社会生活提供新工具、新平台。支持和鼓励华为、腾讯、美团等平台企业,以平台优势提升大模型的竞争力,利用好自己的生态,共享各自大模型能力,不断迭代和训练模型,为更多行业带来智能化机遇。用大模型作为新入口,重构企业业务生态,驱动平台业务的转型。推动制造业和实体经济企业,加速数字化转型,拥抱大模型,利用大模型开发和利用数字工具,以用促创、以创提能。

3.区域布局重构。在科技企业大力布局的同步,在东数西算大框架下,区域间、城市间需要建立算力协同,加强算力开放。加快构建存储+边缘计算+智算+超算多元协同、数智融合的算力体系。以开放包容的全球人才战略, 以大模型为载体,吸引集聚一批算力算法领域的全球人才。

推荐阅读

  • 综研观察

    “下一个中国”还是中国—“量与质”的突围 2024-07-01 14:30
  • 综研观察

    深港河套的五个“突破”和四个“更加注重” 2023-09-06 10:34
  • 综研观察

    数字科技企业财报透露信号:实业兴 平台兴 2023-05-22 09:44
  • 综研观察

    ChatGPT的冷思考:中美企业创新与科技未来 2023-03-16 16:35