大模型,狂热资本走向冷静|2023中国经济半年报
来源:华夏时报
发布时间:2023-07-28 16:47:17
文/卢晓、石飞月
人工智能一直被诟病虚而不实的现象,终于在2023年上半年被打破。ChatGPT,这款聊天机器人模型的诞生和出圈,在短短两个月的时间内聚焦了来自全球的目光,也给了所有在亏损中挣扎的AI企业以希望,因此在过去几个月,局面已经从ChatGPT的一枝独秀升级到“百模大战”。
然而,一场资本的狂欢过后,大模型的热度还能持续多久?有了元宇宙的前车之鉴,人们不禁要思考这个问题。如今,资本市场对于大模型的热情已经消磨一半,再加上应用场景尚不成熟、企业盈利困难重重,待到一切尘埃落定,“百模大战”或许会与当年的“百团大战”一样,只剩寥寥无几的胜利者。
ChatGPT引爆大模型浪潮
今年年初,由人工智能研究实验室OpenAI研发的聊天机器人模型ChatGPT突然风靡全网,从正式发布到此后两个月的时间内,其全球活跃用户数超过一个亿,成为史上增长最快的消费者应用。
在整个人工智能发展史上,甚至可以说在过去20年互联网的迅速发展中,ChatGPT的用户增长速度都可以被称作现象级。
ChatGPT的出圈,就好像手机发展历程中iPhone的走红,人们发现,人工智能不再只是口头上说的一个概念。这款应用能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。
彼时,从朋友圈到微博,从个人社交平台到公共社交平台,到处“充斥”着来自全球网友的使用体验,大家将自己与ChatGPT的对话晒到网上,肯定或调侃这款应用的使用成效。
与之相伴的,还有外界对于ChatGPT越来越多的争议。不少国家和学校警惕ChatGPT对个人数据的捕捉,以及这款应用对学生能力的“腐蚀”。《科学》明确禁止将ChatGPT列为合著者,且不允许在论文中使用ChatGPT所生产的文本;意大利数据保护局(DPA)禁止使用ChatGPT,并限制开发这一平台的OpenAI公司处理意大利用户信息;纽约市教育部宣布禁止学生在其学校的设备和网络上使用ChatGPT,以预防学生作弊的行为……
但这些争议并未挡住ChatGPT的大火,其大模型的概念直接带动了相关板块股票的持续增长。AIGC板块指数从2022年底的886涨到了现在的1411(截至7月25日收盘),中间最高时一度涨到1650。受益最直接的当属AI公司,商汤科技从年初的2.19港元/股最高涨到4月的3.7港元/股;云从科技从年初的10.91元/股最高涨到4月的44.14元/股;科大讯飞从32.8元/股最高涨到6月的81.9元/股。
上游厂商们,包括 AI芯片和AI服务器厂商,也在这股热潮中迎来一波周期性上涨。英伟达在年初开盘时的股价为148.51美元/股,而现在已经涨到446.12美元/股;工业富联年初时的股价为9.14元/股,之后最高涨到27.26元/股;浪潮信息21.43元/股,之后最高涨到43.83元/股。
资本市场受益的同时,不少互联网企业和AI企业趁热打铁, 纷纷围绕大模型推出了自家产品,将这波大模型的热潮推向了顶峰。国外,谷歌推出第二代大语言模型PaLM 2,亚马逊发布了自研大模型Titan,Meta推出了类GPT的大语言模型LLaMA;国内,阿里巴巴的“通义千问”、百度的“文心一言”、科大讯飞的“星火认知大模型”、京东的“言犀产业大模型”、360集团的“360智脑”、字节跳动的“火山方舟”、华为的盘古大模型、商汤科技的“商汤日日新大模型”、云从科技的“从容大模型”……逐渐亮相,以及还在路上的更多大模型产品,大模型的热度扑面而来。
这场大模型的疯狂蔓延,被称为“百模大战”。
大模型开发由来已久
大模型之前,人工智能在更多人眼里其实是个不太接地气的概念。
2016年,谷歌人工智能AlphaGo战胜韩国围棋职业九段围棋手李世石,让普通人第一次对人工智能有了模糊的认知。但AlphaGo仅仅局限于围棋领域,并没有被推广到除围棋以外的任何问题上。
2017年—2021年,以计算机视觉为主要研究方向的一波AI公司开始崛起,最具代表性的便是“AI四小龙”——商汤科技、云从科技、旷视科技和依图科技。但计算机视觉更多应用在to B领域,即便是to C领域中人们可以接触到的人脸识别,和大家想象中的人工智能还是有很大差距。
直到ChatGPT的出现。
事实上,大模型的爆火并不是偶然,不少企业早有布局。阿里巴巴早在2020年初就已经启动中文多模态预训练模型M6项目,并在同年6月推出了3亿参数的基础模,2021年5月,具有万亿参数规模的模型正式投入使用;华为同样在2020年开始布局大模型,2021年基于昇腾AI与鹏城实验室联合发布了鹏程盘古大模型,是业界首个千亿级生成和理解中文NLP大模型。
但这些大模型都没像ChatGPT一样起到引领“潮流”的作用,这一方面源于国内企业的大模型更加偏向to B市场,出圈机会不及to C的ChatGPT,另一方面则在于国内大模型在性能上与ChatGPT表现出的差距。
通过ChatGPT所能完成的网友要求,可以看到这款应用表现出了近乎于人类的语言表达能力、超强的学习能力以及语义理解能力,能够应用的场景领域不仅包括专业的职业测试,还能撰写学术论文,但这些,似乎没有在任意一款国产大模型上体现出来。
支撑这种超强学习能力的一个重要指标就是参数。据了解,GPT-4在120层中总共包含了1.8万亿参数,规模是GPT-3的10倍以上。而国内的大模型产品基本还处于千亿级别,如“360智脑4.0”融合千亿参数、百度文心一言大模型参数量在两千亿级以上、京东言犀大模型的参数量为千亿级……
另一个重要的技术支撑就是算力。但受地缘政治影响,英伟达的A100和H100芯片无法在国内实现大规模应用,英伟达特意针对中国市场推出的阉割版GPU-A800和H800,不仅与以上两款在性能上有差距,未来也存在断供的风险。
总体来说,通用大模型的进一步完善,对数据、算力、资金的要求都非常高,而国内能负担得起的企业恐怕只有几家头部企业。
因此,小规模的AI公司已经开始探索成本更低的行业大模型。日前,云从科技就宣布将定向募集不超过36.35亿元的资金总额用于行业大模型项目。
在云从科技看来,行业大模型无论在成本还是实用性上都有研发的必要性。云从科技联合创始人姚志强认为:“通用大模型的迭代的成本是非常高的,虽然说现在很多传统企业都有试用的冲动,慢慢就会冷静下来,独立开发运维迭代实在不划算,这就是行业大模型的机会。”
腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生也对行业大模型表示了肯定,“通用大模型有很强的能力,但并不能解决很多企业的具体问题,在100个场景中可以解决70%—80%的问题,但未必能100%满足企业某个场景的需求。但企业如果基于行业大模型,再加上自身数据进行精调,可以建构专属模型,打造出高可用的智能服务。”
市场淘汰战终将上演
值得一提的是,无论是通用大模型还是行业大模型,在爆火的这半年时间里,业内一直在提出一个疑问:大模型的热度,会不会和元宇宙一样昙花一现?
其实资本市场已经率先做出了反应,今年4月—6月期间,AI行情分化,并多次出现整体下挫的现象。云从科技的股价从今年4月最高点时的44.14元/股跌到16.81元/股(截至7月25日收盘);科大讯飞从6月最高的81.9元/股跌到64.31元/股。
而像英伟达这样有业绩落地、在行业内居头部地位的企业,股价仍然处于上行通道,截至7月25日凌晨收盘,其市值已经达到1.1万亿美元。
资本和投资机构对于AI企业和项目当然有自己的判断,到底是赚一笔就走,还是留下来面对不确定的以后。红点中国执行董事刘岚曾表示:“我们目前更看重商业落地的速度和产品技术优势的相对平衡。只有技术没有商业化,以及有商业化,技术不够领先的企业,我们都会比较慎重。”
商业化的目标就是盈利,只有盈利,投资机构和企业本身才能得到更大的利益。但以目前的情况来看,盈利仍是大多数企业短时间难以实现的目标。
文渊智库创始人王超对《华夏时报》记者表示,真正投入做大模型项目,既要有人才储备,又需要大规模的资金,至于回报周期目前还待定,这与投入时间和产品在市场上的受欢迎程度有关系,比如ChatGPT现在就是供不应求的状态,今年的爆火能够直接产生收益,资本市场给的估值也很高,但初创企业或者新入局的企业,所推出的产品还要进一步磨合,市场认可也需要时间。
由于训练成本过高,ChatGPT的开发公司OpenAI仍然在2022年出现5.4亿美元左右的亏损。据媒体报道,OpenAI首席执行官Sam Altman私下表示,该公司必须筹集多达 1000 亿美元的资金,才能满足不断上涨的成本。研究机构PitchBook预测,OpenAI在2023年有望产生2亿美元的收入,较2022年增长150%。
用户对大模型的探索热情也在消减。网络分析公司Similarweb统计的数据显示,2023年前5个月,ChatGPT全球访问量环比增幅分别为131.6%、62.5%、55.8%、12.6%、2.8%,增长幅度明显下降,6月ChatGPT的访问量环比下滑9.7%,为其推出以来首次。而国内的大模型产品,目前都还处于概念或者产品阶段,未实现规模化应用。
尽管来自资本和用户的热情暂时消减,在业内人士看来,以大模型为基座的人工智能通用能力不会昙花一现。弘玑北大联合实验室首席科学家马修军在2023世界人工智能大会上强调了这一点,“我们已经进入了以大模型为基础的APP Store时代,基于基础模型,可以利用API和大模型的能力来开发我们自己的人工智能应用,由此诞生的产业链和生态已经超越了移动互联网的影响力。”
而在“百模大战”后,有市场声音认为,国内AI大模型最终胜出的不超过2%,这意味着,剩下98%的国内大模型都会消失在竞争中。百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜最近也指出,未来国内将只会有少量大模型。
既然会遭遇市场淘汰,在深度科技研究院院长张孝荣看来,提供不了庞大资金和庞大优质数据量的中小型企业,不如早点探索其它方向。“AI行业的发展是波浪式前进的,高潮过后很快就是低谷,低谷之后往往也会出现新的高潮,在高潮的时候,跟风项目很少能活下来,在低谷时期,往往会有新公司或个人发明新的技术路线,从而让行业进入新的发展阶段。我认为,大模型的发展即将遇到天花板,这一轮产业热潮也即将结束,要把资源和精力放在新的技术路线和新的创新活动上,以便迎接下一轮高潮的开启。”
责任编辑:黄兴利 主编:寒丰
查看更多华夏时报文章,参与华夏时报微信互动(微信搜索「华夏时报」或「chinatimes」)