首页金融正文

国内大模型能达到Sora水平吗？权威解读来了

作者：李明会

来源：华夏时报

发布时间：2024-04-14 10:21:59

   

摘要：作为人工智能发展的核心引擎，国外的大模型不断引爆国内舆论场、刷新大众认知，我们的国产大模型还能弯道超车吗？今年是大模型应用元年，在现实的不同场景之下，大模型又将与产业擦出什么样的火花？

国内大模型能达到Sora水平吗？权威解读来了

华夏时报（www.chinatimes.net.cn）记者李明会北京报道

伴随着ChatGPT、Sora、Figure01不断引发全球关注，人工智能（AI）的惊人迭代速度不断扩展着人们的想象空间。

中国正发出拥抱新一轮科技和产业浪潮的新信号，发力以人工智能为引擎的新质生产力。

自2017年以来，人工智能多次被写入《政府工作报告》。2024年两会期间，“人工智能+”首次被写入《政府工作报告》。报告提出，深化大数据、人工智能等研发应用，开展“人工智能+”行动，打造具有国际竞争力的数字产业集群。

问题随之而来，作为人工智能发展的核心引擎，国外的大模型不断引爆国内舆论场、刷新大众认知，我们的国产大模型还能弯道超车吗？今年是大模型应用元年，在现实的不同场景之下，大模型又将与产业擦出什么样的火花？

4月13日晚间，中央广播电视总台财经节目中心《对话》栏目播出了新一期节目《AI+未来大猜想》。四位企业家——360集团创始人周鸿祎、国产大模型独角兽智谱AI CEO（首席执行官）张鹏、人形机器人初创公司九光智能创始人徐志根、广药集团董事长李楚源，以及三位财经媒体代表——《华夏时报》执行总编辑张志伟、《中国企业家》杂志副总编辑何伊凡、《财经》杂志副主编朱弢，和中央电视台主持人靳强一道共同探讨人工智能的技术发展、商业化路径等话题。

对于上述两个问题，本文撷取了相关节目要点。

大模型做“小”也能弯道超车

靳强：OpenAI发布Sora，掀起新一轮对人工智能的讨论热潮，国产大模型能达到Sora的水平吗?

张鹏：Sora确实令人惊艳，但我们仔细研究了它的技术报告之后，发现它并没有外界看起来的那么新奇。Sora运用到的仍是已有的技术，只不过OpenAI把这些技术综合起来从工程上进行了优化，做到了之前的人没有做到的事情。

我觉得，国产大模型能否做到Sora这种水平就是一个资源和时间的问题。因为Sora本身还有很多创新的技术大家还在研究，我也不敢特别准地去预测需要多少时间，但我相信应该不需要太久。

张志伟：周鸿祎先生在今年两会期间接受《华夏时报》记者采访时曾表示，中国大模型的水平相当于美国GPT-3.5的水平。如何做出这个判断？

周鸿祎：首先，我认为有差距是必然的，知道差距是多少，剩下的就是追赶问题。

我现在说话比较谨慎，你说大了，别人说你自卑；你说小了，别人说你自大。按照刷榜的成绩，国内的模型早就超过了GPT-4了。但真正用一用，我觉得国内的大部分都达到或者超过了GPT-3.5的能力，全世界也就只有中国有这个能力。

如果GPT-4是100分的话，GPT-3.5差不多应该有75分到80分，我认为这个速度就很快了。

其次，美国也不是全面领先，美国真正在人工智能领先的公司，我认为就两家，软件是OpenAI，硬件是英伟达。

我认为，大模型比光刻机、芯片的难度要低很多，因为毕竟是软件，但未来是要奔着AGI，也就是通用人工智能去的，这块的挑战就是算力。

但如果把大模型越做越小，走垂直化、产业化、企业化、场景化的道路，可能不需要万亿、千亿的参数，只需要百亿的参数，再加上一些私有的核心数据加持，在一个垂直单元上是可以超过GPT-4的。这就对算力的要求就降到很低，可能有十张消费级显卡在一个场景就能用起来，非常适合我们国家，这也是我们弯道超车的一个场景。

我们有这么多的工业门类，国家这么重视制造业的数字化转型，如果中国企业都用上了这种小规模的大模型，在自己的场景上让大模型跟业务相结合，其意义不亚于我们在超级AGI上追赶国外。

大模型与产业的结合：小切口，大纵深

张志伟：周鸿祎先生说过，今年是大模型场景应用元年。关于大模型如何与产业相结合，你提出了一个理念，叫“小切口，大纵深”。能不能展开聊聊？

周鸿祎：我们去年从to B模式中找到一些方法论。

比如，要给医疗机构做一个医药医疗大模型，必须把医疗进行场景细分——在里边找出50到100个场景，并对每个场景分析，看看文章生成、情感判断、内容翻译等大模型最常见的功能能不能发挥作用。

能不能做这个大模型取决于两个因素：一是场景下有没有数据知识，因为没有知识、光有场景，训不出大模型。二是看大模型的容错度，因为大模型最致命的就是“幻觉”，如果某个场景中不能承受幻觉风险，那这个场景就不能用到大模型里。

所以我主张要在企业用大模型不要一下子宏大叙事，而是在内部业务链条，或在外部产品功能中，选取两到三个场景，用大模型赋能。如果能取得成绩，我认为就已经是很大的进步了。所以，我谈的“小切口”，就是刚开始宁可保守一点，积小胜于大胜。

而“大纵深”是什么概念呢？大模型像发动机，现在大模型厂商在造世界上最牛、最快的发动机，但是B端企业要的不是发动机，而是一辆车。所以，我们要找到一个底盘，把发动机装上，再给它装上外壳、座椅，最后交付一辆车，企业才能用。

2023年，中国有上百家公司在做大模型，鱼龙混杂，泥沙俱下。今年就消停很多了，因为很多企业知道，有些特别难的事自己也做不了。据我了解，现在的大模型厂商纷纷转型，往产业方向走、往垂直方向走。

张鹏：通用大模型的能力提升所衍生的能力，能让我们去寻找到“大模型原生的应用”或者“大模型原生场景”。但是在这个过程当中，技术需要发展，产业也需要落地。打个比方，现在我们造出内燃机了，不能说我想造飞机，内燃机不能用，我不管了，我要造喷气发动机去。既然内燃机可以造出汽车，那就先把汽车造出来，我觉得这是不矛盾的一件事情。

责任编辑：孟俊莲主编：张志伟