大模型，狂热资本走向冷静｜2023中国经济半年报

来源：华夏时报

发布时间：2023-07-28 16:47:17

摘要：人工智能一直被诟病虚而不实的现象，终于在2023年上半年被打破。ChatGPT，这款聊天机器人模型的诞生和出圈，在短短两个月的时间内聚焦了来自全球的目光，也给了所有在亏损中挣扎的AI企业以希望，因此在过去几个月，局面已经从ChatGPT的一枝独秀升级到“百模大战”。

文/卢晓、石飞月

人工智能一直被诟病虚而不实的现象，终于在2023年上半年被打破。ChatGPT，这款聊天机器人模型的诞生和出圈，在短短两个月的时间内聚焦了来自全球的目光，也给了所有在亏损中挣扎的AI企业以希望，因此在过去几个月，局面已经从ChatGPT的一枝独秀升级到“百模大战”。

然而，一场资本的狂欢过后，大模型的热度还能持续多久？有了元宇宙的前车之鉴，人们不禁要思考这个问题。如今，资本市场对于大模型的热情已经消磨一半，再加上应用场景尚不成熟、企业盈利困难重重，待到一切尘埃落定，“百模大战”或许会与当年的“百团大战”一样，只剩寥寥无几的胜利者。

ChatGPT引爆大模型浪潮

今年年初，由人工智能研究实验室OpenAI研发的聊天机器人模型ChatGPT突然风靡全网，从正式发布到此后两个月的时间内，其全球活跃用户数超过一个亿，成为史上增长最快的消费者应用。

在整个人工智能发展史上，甚至可以说在过去20年互联网的迅速发展中，ChatGPT的用户增长速度都可以被称作现象级。

ChatGPT的出圈，就好像手机发展历程中iPhone的走红，人们发现，人工智能不再只是口头上说的一个概念。这款应用能够通过理解和学习人类的语言来进行对话，还能根据聊天的上下文进行互动，真正像人类一样来聊天交流，甚至能完成撰写邮件、视频脚本、文案、翻译、代码，写论文等任务。

彼时，从朋友圈到微博，从个人社交平台到公共社交平台，到处“充斥”着来自全球网友的使用体验，大家将自己与ChatGPT的对话晒到网上，肯定或调侃这款应用的使用成效。

与之相伴的，还有外界对于ChatGPT越来越多的争议。不少国家和学校警惕ChatGPT对个人数据的捕捉，以及这款应用对学生能力的“腐蚀”。《科学》明确禁止将ChatGPT列为合著者，且不允许在论文中使用ChatGPT所生产的文本；意大利数据保护局（DPA）禁止使用ChatGPT，并限制开发这一平台的OpenAI公司处理意大利用户信息；纽约市教育部宣布禁止学生在其学校的设备和网络上使用ChatGPT，以预防学生作弊的行为……

但这些争议并未挡住ChatGPT的大火，其大模型的概念直接带动了相关板块股票的持续增长。AIGC板块指数从2022年底的886涨到了现在的1411（截至7月25日收盘），中间最高时一度涨到1650。受益最直接的当属AI公司，商汤科技从年初的2.19港元/股最高涨到4月的3.7港元/股；云从科技从年初的10.91元/股最高涨到4月的44.14元/股；科大讯飞从32.8元/股最高涨到6月的81.9元/股。

上游厂商们，包括 AI芯片和AI服务器厂商，也在这股热潮中迎来一波周期性上涨。英伟达在年初开盘时的股价为148.51美元/股，而现在已经涨到446.12美元/股；工业富联年初时的股价为9.14元/股，之后最高涨到27.26元/股；浪潮信息21.43元/股，之后最高涨到43.83元/股。

资本市场受益的同时，不少互联网企业和AI企业趁热打铁，纷纷围绕大模型推出了自家产品，将这波大模型的热潮推向了顶峰。国外，谷歌推出第二代大语言模型PaLM 2，亚马逊发布了自研大模型Titan，Meta推出了类GPT的大语言模型LLaMA；国内，阿里巴巴的“通义千问”、百度的“文心一言”、科大讯飞的“星火认知大模型”、京东的“言犀产业大模型”、360集团的“360智脑”、字节跳动的“火山方舟”、华为的盘古大模型、商汤科技的“商汤日日新大模型”、云从科技的“从容大模型”……逐渐亮相，以及还在路上的更多大模型产品，大模型的热度扑面而来。

这场大模型的疯狂蔓延，被称为“百模大战”。

大模型开发由来已久

大模型之前，人工智能在更多人眼里其实是个不太接地气的概念。

2016年，谷歌人工智能AlphaGo战胜韩国围棋职业九段围棋手李世石，让普通人第一次对人工智能有了模糊的认知。但AlphaGo仅仅局限于围棋领域，并没有被推广到除围棋以外的任何问题上。

2017年—2021年，以计算机视觉为主要研究方向的一波AI公司开始崛起，最具代表性的便是“AI四小龙”——商汤科技、云从科技、旷视科技和依图科技。但计算机视觉更多应用在to B领域，即便是to C领域中人们可以接触到的人脸识别，和大家想象中的人工智能还是有很大差距。

直到ChatGPT的出现。

事实上，大模型的爆火并不是偶然，不少企业早有布局。阿里巴巴早在2020年初就已经启动中文多模态预训练模型M6项目，并在同年6月推出了3亿参数的基础模，2021年5月，具有万亿参数规模的模型正式投入使用；华为同样在2020年开始布局大模型，2021年基于昇腾AI与鹏城实验室联合发布了鹏程盘古大模型，是业界首个千亿级生成和理解中文NLP大模型。

但这些大模型都没像ChatGPT一样起到引领“潮流”的作用，这一方面源于国内企业的大模型更加偏向to B市场，出圈机会不及to C的ChatGPT，另一方面则在于国内大模型在性能上与ChatGPT表现出的差距。

通过ChatGPT所能完成的网友要求，可以看到这款应用表现出了近乎于人类的语言表达能力、超强的学习能力以及语义理解能力，能够应用的场景领域不仅包括专业的职业测试，还能撰写学术论文，但这些，似乎没有在任意一款国产大模型上体现出来。

支撑这种超强学习能力的一个重要指标就是参数。据了解，GPT-4在120层中总共包含了1.8万亿参数，规模是GPT-3的10倍以上。而国内的大模型产品基本还处于千亿级别，如“360智脑4.0”融合千亿参数、百度文心一言大模型参数量在两千亿级以上、京东言犀大模型的参数量为千亿级……

另一个重要的技术支撑就是算力。但受地缘政治影响，英伟达的A100和H100芯片无法在国内实现大规模应用，英伟达特意针对中国市场推出的阉割版GPU-A800和H800，不仅与以上两款在性能上有差距，未来也存在断供的风险。

总体来说，通用大模型的进一步完善，对数据、算力、资金的要求都非常高，而国内能负担得起的企业恐怕只有几家头部企业。

因此，小规模的AI公司已经开始探索成本更低的行业大模型。日前，云从科技就宣布将定向募集不超过36.35亿元的资金总额用于行业大模型项目。

在云从科技看来，行业大模型无论在成本还是实用性上都有研发的必要性。云从科技联合创始人姚志强认为：“通用大模型的迭代的成本是非常高的，虽然说现在很多传统企业都有试用的冲动，慢慢就会冷静下来，独立开发运维迭代实在不划算，这就是行业大模型的机会。”

腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生也对行业大模型表示了肯定，“通用大模型有很强的能力，但并不能解决很多企业的具体问题，在100个场景中可以解决70%—80%的问题，但未必能100%满足企业某个场景的需求。但企业如果基于行业大模型，再加上自身数据进行精调，可以建构专属模型，打造出高可用的智能服务。”

市场淘汰战终将上演

值得一提的是，无论是通用大模型还是行业大模型，在爆火的这半年时间里，业内一直在提出一个疑问：大模型的热度，会不会和元宇宙一样昙花一现？

其实资本市场已经率先做出了反应，今年4月—6月期间，AI行情分化，并多次出现整体下挫的现象。云从科技的股价从今年4月最高点时的44.14元/股跌到16.81元/股（截至7月25日收盘）；科大讯飞从6月最高的81.9元/股跌到64.31元/股。

而像英伟达这样有业绩落地、在行业内居头部地位的企业，股价仍然处于上行通道，截至7月25日凌晨收盘，其市值已经达到1.1万亿美元。

资本和投资机构对于AI企业和项目当然有自己的判断，到底是赚一笔就走，还是留下来面对不确定的以后。红点中国执行董事刘岚曾表示：“我们目前更看重商业落地的速度和产品技术优势的相对平衡。只有技术没有商业化，以及有商业化，技术不够领先的企业，我们都会比较慎重。”

商业化的目标就是盈利，只有盈利，投资机构和企业本身才能得到更大的利益。但以目前的情况来看，盈利仍是大多数企业短时间难以实现的目标。

文渊智库创始人王超对《华夏时报》记者表示，真正投入做大模型项目，既要有人才储备，又需要大规模的资金，至于回报周期目前还待定，这与投入时间和产品在市场上的受欢迎程度有关系，比如ChatGPT现在就是供不应求的状态，今年的爆火能够直接产生收益，资本市场给的估值也很高，但初创企业或者新入局的企业，所推出的产品还要进一步磨合，市场认可也需要时间。

由于训练成本过高，ChatGPT的开发公司OpenAI仍然在2022年出现5.4亿美元左右的亏损。据媒体报道，OpenAI首席执行官Sam Altman私下表示，该公司必须筹集多达 1000 亿美元的资金，才能满足不断上涨的成本。研究机构PitchBook预测，OpenAI在2023年有望产生2亿美元的收入，较2022年增长150%。

用户对大模型的探索热情也在消减。网络分析公司Similarweb统计的数据显示，2023年前5个月，ChatGPT全球访问量环比增幅分别为131.6%、62.5%、55.8%、12.6%、2.8%，增长幅度明显下降，6月ChatGPT的访问量环比下滑9.7%，为其推出以来首次。而国内的大模型产品，目前都还处于概念或者产品阶段，未实现规模化应用。

尽管来自资本和用户的热情暂时消减，在业内人士看来，以大模型为基座的人工智能通用能力不会昙花一现。弘玑北大联合实验室首席科学家马修军在2023世界人工智能大会上强调了这一点，“我们已经进入了以大模型为基础的APP Store时代，基于基础模型，可以利用API和大模型的能力来开发我们自己的人工智能应用，由此诞生的产业链和生态已经超越了移动互联网的影响力。”

而在“百模大战”后，有市场声音认为，国内AI大模型最终胜出的不超过2%，这意味着，剩下98%的国内大模型都会消失在竞争中。百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜最近也指出，未来国内将只会有少量大模型。

既然会遭遇市场淘汰，在深度科技研究院院长张孝荣看来，提供不了庞大资金和庞大优质数据量的中小型企业，不如早点探索其它方向。“AI行业的发展是波浪式前进的，高潮过后很快就是低谷，低谷之后往往也会出现新的高潮，在高潮的时候，跟风项目很少能活下来，在低谷时期，往往会有新公司或个人发明新的技术路线，从而让行业进入新的发展阶段。我认为，大模型的发展即将遇到天花板，这一轮产业热潮也即将结束，要把资源和精力放在新的技术路线和新的创新活动上，以便迎接下一轮高潮的开启。”

责任编辑：黄兴利主编：寒丰