首页金融正文

国内大模型能达到Sora水平吗?权威解读来了

作者:李明会

来源:华夏时报

发布时间:2024-04-14 10:21:59

摘要:作为人工智能发展的核心引擎,国外的大模型不断引爆国内舆论场、刷新大众认知,我们的国产大模型还能弯道超车吗?今年是大模型应用元年,在现实的不同场景之下,大模型又将与产业擦出什么样的火花?

国内大模型能达到Sora水平吗?权威解读来了

华夏时报(www.chinatimes.net.cn)记者 李明会 北京报道

伴随着ChatGPT、Sora、Figure01不断引发全球关注,人工智能(AI)的惊人迭代速度不断扩展着人们的想象空间。

中国正发出拥抱新一轮科技和产业浪潮的新信号,发力以人工智能为引擎的新质生产力。

自2017年以来,人工智能多次被写入《政府工作报告》。2024年两会期间,“人工智能+”首次被写入《政府工作报告》。报告提出,深化大数据、人工智能等研发应用,开展“人工智能+”行动,打造具有国际竞争力的数字产业集群。

问题随之而来,作为人工智能发展的核心引擎,国外的大模型不断引爆国内舆论场、刷新大众认知,我们的国产大模型还能弯道超车吗?今年是大模型应用元年,在现实的不同场景之下,大模型又将与产业擦出什么样的火花?

4月13日晚间,中央广播电视总台财经节目中心《对话》栏目播出了新一期节目《AI+未来大猜想》。四位企业家——360集团创始人周鸿祎、国产大模型独角兽智谱AI CEO(首席执行官)张鹏、人形机器人初创公司九光智能创始人徐志根、广药集团董事长李楚源,以及三位财经媒体代表——《华夏时报》执行总编辑张志伟、《中国企业家》杂志副总编辑何伊凡、《财经》杂志副主编朱弢,和中央电视台主持人靳强一道共同探讨人工智能的技术发展、商业化路径等话题。

对于上述两个问题,本文撷取了相关节目要点。

大模型做“小”也能弯道超车

靳强:OpenAI发布Sora,掀起新一轮对人工智能的讨论热潮,国产大模型能达到Sora的水平吗?

张鹏:Sora确实令人惊艳,但我们仔细研究了它的技术报告之后,发现它并没有外界看起来的那么新奇。Sora运用到的仍是已有的技术,只不过OpenAI把这些技术综合起来从工程上进行了优化,做到了之前的人没有做到的事情。

我觉得,国产大模型能否做到Sora这种水平就是一个资源和时间的问题。因为Sora本身还有很多创新的技术大家还在研究,我也不敢特别准地去预测需要多少时间,但我相信应该不需要太久。

张志伟:周鸿祎先生在今年两会期间接受《华夏时报》记者采访时曾表示,中国大模型的水平相当于美国GPT-3.5的水平。如何做出这个判断?

周鸿祎:首先,我认为有差距是必然的,知道差距是多少,剩下的就是追赶问题。

我现在说话比较谨慎,你说大了,别人说你自卑;你说小了,别人说你自大。按照刷榜的成绩,国内的模型早就超过了GPT-4了。但真正用一用,我觉得国内的大部分都达到或者超过了GPT-3.5的能力,全世界也就只有中国有这个能力。

如果GPT-4是100分的话,GPT-3.5差不多应该有75分到80分,我认为这个速度就很快了。

其次,美国也不是全面领先,美国真正在人工智能领先的公司,我认为就两家,软件是OpenAI,硬件是英伟达。

我认为,大模型比光刻机、芯片的难度要低很多,因为毕竟是软件,但未来是要奔着AGI,也就是通用人工智能去的,这块的挑战就是算力。

但如果把大模型越做越小,走垂直化、产业化、企业化、场景化的道路,可能不需要万亿、千亿的参数,只需要百亿的参数,再加上一些私有的核心数据加持,在一个垂直单元上是可以超过GPT-4的。这就对算力的要求就降到很低,可能有十张消费级显卡在一个场景就能用起来,非常适合我们国家,这也是我们弯道超车的一个场景。

我们有这么多的工业门类,国家这么重视制造业的数字化转型,如果中国企业都用上了这种小规模的大模型,在自己的场景上让大模型跟业务相结合,其意义不亚于我们在超级AGI上追赶国外。

大模型与产业的结合:小切口,大纵深

张志伟:周鸿祎先生说过,今年是大模型场景应用元年。关于大模型如何与产业相结合,你提出了一个理念,叫“小切口,大纵深”。能不能展开聊聊?

周鸿祎:我们去年从to B模式中找到一些方法论。

比如,要给医疗机构做一个医药医疗大模型,必须把医疗进行场景细分——在里边找出50到100个场景,并对每个场景分析,看看文章生成、情感判断、内容翻译等大模型最常见的功能能不能发挥作用。

能不能做这个大模型取决于两个因素:一是场景下有没有数据知识,因为没有知识、光有场景,训不出大模型。二是看大模型的容错度,因为大模型最致命的就是“幻觉”,如果某个场景中不能承受幻觉风险,那这个场景就不能用到大模型里。

所以我主张要在企业用大模型不要一下子宏大叙事,而是在内部业务链条,或在外部产品功能中,选取两到三个场景,用大模型赋能。如果能取得成绩,我认为就已经是很大的进步了。所以,我谈的“小切口”,就是刚开始宁可保守一点,积小胜于大胜。

而“大纵深”是什么概念呢?大模型像发动机,现在大模型厂商在造世界上最牛、最快的发动机,但是B端企业要的不是发动机,而是一辆车。所以,我们要找到一个底盘,把发动机装上,再给它装上外壳、座椅,最后交付一辆车,企业才能用。

2023年,中国有上百家公司在做大模型,鱼龙混杂,泥沙俱下。今年就消停很多了,因为很多企业知道,有些特别难的事自己也做不了。据我了解,现在的大模型厂商纷纷转型,往产业方向走、往垂直方向走。

张鹏:通用大模型的能力提升所衍生的能力,能让我们去寻找到“大模型原生的应用”或者“大模型原生场景”。但是在这个过程当中,技术需要发展,产业也需要落地。打个比方,现在我们造出内燃机了,不能说我想造飞机,内燃机不能用,我不管了,我要造喷气发动机去。既然内燃机可以造出汽车,那就先把汽车造出来,我觉得这是不矛盾的一件事情。

责任编辑:孟俊莲 主编:张志伟

查看更多华夏时报文章,参与华夏时报微信互动(微信搜索「华夏时报」或「chinatimes」)