首页评论正文

注重解决复杂问题,走出人工智能发展新路

作者:李国杰

来源:华夏时报

发布时间:2023-08-24 12:40:15

摘要:目前人工智能发挥巨大作用的领域,不论是视觉听觉感知、自然语言理解,还是蛋白质结构预测等科学研究,面对的都是复杂性极高的问题,用传统的演绎推理和归纳推理无法解决。有些学者批评机器学习没有形式化的公理体系和简洁的数学公式,我想这是“不能也,非不为也”,解决复杂问题需要新的科学范式。

注重解决复杂问题,走出人工智能发展新路

李国杰/文

雷峰网发给我待出版的《中国人工智能简史》第1卷电子版,希望我写一篇序言。我一口气读完了这本史料丰富、动人心弦的大作,感到中国人工智能的发展既波澜壮阔,又蜿蜒崎岖,可歌可泣。

我与此书的作者交往不多,较深入的接触只有雷峰网的一次采访。读完此书以后,我深深佩服作者纵览全局的广阔视野和媒体人旁搜博采的功夫。在我看来,这本简史有四个特点。

第一是中立客观,尊重历史。人工智能涉及的学科很多,门派也很多,各人有各人的说法。本书作者站在客观的立场上,尽量还原历史。既不一味夸赞伟人,也不抹杀一线科技工作者的贡献。对于历史上的是非功过不作武断的评价,而是充分用事实说话。中国的人工智能界没有明斯基、麦卡锡、司马贺、费根鲍姆、辛顿这样的权威学者,但有许许多多为人工智能发展作出贡献的科技工作者。如果说中国的人工智能界是一座花园,这里没有参天的乔木,但灌木丛生,百花盛开。作者如同一位热心的导游,心平气和地向来访者介绍每一朵鲜花的特点。

第二是纵观全局,眼观六路。虽然国际上将人工智能看成计算机学科的一个分支,但实际上人工智能涉及哲学、数学、计算机、自动控制、心理学等诸多学科。特别是在中国,早期许多人工智能学者并非出自计算机领域。这本简史讲述了与人工智能有关的各个领域学者的贡献,主要的贡献者几乎没有被遗漏。

第三是人事交融,脉络清晰。一部简史,如果只按时间顺序分章叙述各种技术的发展,就会给人凌乱的感觉;如果按照逻辑推理、机器学习等不同的技术分章叙述,见事不见人,就会呆板无味。这本简史基本上以年份为章节,每一章突出一种技术和几个重点人物,把人的故事融入技术发展之中,既写了事,又写了人,技术发展的脉络也十分清楚,找到了兼顾人和事的史书写法。

第四是细节动人,以事寓理。一本史书可以写得干巴巴的,充满八股气,也可以笔翰如流,让人读得津津有味,这全看作者的功底。这本简史每写到一个人物或一桩往事,都能旁征博引,信手拈来,全无痕迹,可读性很强,充分显示了作者知识渊博,兼有媒体人的敏锐和学者的底蕴。

这本书是《中国人工智能简史》的第1卷,从1979年开始,写到1993年。这15年内,中国人工智能界经历了许多重要的事件,其中一件大事是国家启动了“863战略高技术计划”,信息领域有一个主题是智能计算机,代号“863-306”。“863计划”启动之时正是人工智能的辉煌时期,由于日本第五代计算机的失败和人工智能研究遇到发展瓶颈,20世纪90年代全球人工智能又一次跌入低谷。在这一转折的时刻,“863-306”主题通过持续的投入,在高性能计算机、智能接口、智能应用等方面取得了一批重大的科研成果。更有价值的是,这为我国发展人工智能培养了一大批人才,奠定了较为坚实的人才基础。今天中国有能力在人工智能技术上与美国抗争,“863计划”功不可没。本书第8章和第15章讲述了“863-306”主题激动人心的故事。

我于1990年担任国家智能计算机研究开发中心(NCIC,下称“智能中心”)主任,被选为第二届智能计算机专家组成员,1992年担任专家组副组长(组长是汪成为),参与了“863-306”主题早期的决策和部署。智能中心于1990年成立,2004年以后并入中科院计算所,活跃期不到15年,但在历史上留下了光辉的痕迹。这个中心最鼎盛时也只有100余人,但培养出3位院士、8位正局级科技领导人才,以及曙光、海光、北京君正、中科星图、汉王等十几家高技术公司的总裁,公司市值总和超过5000亿元,还走出了好几位国际著名的大学者,如被誉为“AI预测蛋白质结构全球第一人”的许锦波等。社会上普遍知道的是,智能中心研制成功了“曙光一号”“曙光1000”等多个系列的高性能计算机。其实,智能中心还做了许多与人工智能有关的科研工作。每年智能中心进行的汉字识别和语音识别测试有力地推动了我国智能接口技术的发展。智能中心和中国自动化学会、中科院合肥智能机械所合办的《模式识别与人工智能》是我国人工智能界的核心刊物。科大讯飞公司的母体是智能中心中国科大分中心,当年负责语音库的建设。汉王公司的总裁刘昌平也出自智能中心。智能中心的理论组只有十余人,就走出了白硕、蒋昌俊、姚新、程学旗、刘群、卜东波等多位人工智能领域的知名学者。本书第14章称智能中心是“年轻人才的特区”恰如其分。智能中心对年轻人高度信任,敢压重担,促使人才辈出,这一体制机制改革的成功经验值得传承。

特别值得一提的是,1996年3月,智能中心和Motorola公司合作成立联合实验室(Motorola-NCICJDL),从事多媒体、人工智能、人机先进通信等技术研究,双方轮流选派JDL负责人。高文是国家智能中心推荐的JDL第一期负责人,他现在是鹏城国家实验室主任。JDL在视频编码、模式识别、人工智能等领域培养了一批领军人才,如王海峰、陈熙霖、黄铁军、徐波、吴枫、李锦涛、陈益强、山世光、黄庆民等,当时的年轻人现在都已成为我国人工智能界的风云人物,其中不少是院士候选人。Motorola-NCICJDL不愧为培养人工智能人才的摇篮。

我1981年到美国普渡大学攻读博士学位,从事与人工智能有关的研究。1984年,我在AAAI(国际先进人工智能协会)大会上发表了论文,是较早在AAAI发表论文的中国学者。后来我陆续在IEEE(电气与电子工程师协会)Computer等国际一流期刊和ISCA(国际计算机体系结构研讨会)等顶级国际会议以及国内的期刊上发表了几十篇与人工智能有关的论文,包括几篇关于智能计算机的特约长篇综述文章。我与我的导师华云生(BenjaminWah)合作编著了ComputersforArtifcialIntelligenceApplications,这本书连续3年都是IEEE最畅销的出版物,在人工智能界产生了一定的影响,应当说我算是第二波人工智能的“弄潮儿”之一。1987年回国工作后,我将重心放在高性能计算机的研制上,管理工作任务繁重,没有在人工智能的科研中做出影响很大的成果,这是我终生的遗憾,但我从未停止过对人工智能的关注。读了这本简史以后,我有一些感想和看法,写出来供大家参考。

中国人工智能学会最初没有挂靠在中国科学技术协会,而是挂靠在中国社会科学院,这看起来有点奇怪,但实际上有着深刻的社会背景。人工智能不是纯粹的自然科学,因为与人的智能有关,所以它必然与哲学有天然的联系。早期哲学家的强势介入可能使一部分计算机领域的人工智能学者远离人工智能学会,但是到了今天,语言大模型的出现对认识论产生了巨大冲击,机器可能具有与人不同的认知方式,特别需要哲学家和人文学者介入人工智能。尤其是人工智能的伦理问题越来越突出,更需要社会科学领域的学者参与讨论,制定合理的政策。

从提出图灵测试开始,人工智能研究的主流就是拿机器与人比,模式识别、自然语言理解等领域都是用“是否达到人类的水平”作为考核人工智能的标准,这方面的研究已取得很大的成功。但从实用和工程的角度来说,人工智能的目标是解决复杂的问题。在创建人工智能学科的达特茅斯会议上,会议的主角之一司马贺曾建议把这一学科叫作“复杂信息处理”。如果当时采纳了他的意见,世上就没有“人工智能”这个术语,也许今天的人们会更加重视如何对付复杂性这个难题。目前人工智能发挥巨大作用的领域,不论是视觉听觉感知、自然语言理解,还是蛋白质结构预测等科学研究,面对的都是复杂性极高的问题,用传统的演绎推理和归纳推理无法解决。有些学者批评机器学习没有形式化的公理体系和简洁的数学公式,我想这是“不能也,非不为也”,解决复杂问题需要新的科学范式。希望人工智能界更加注重“解决复杂问题”,走出一条发展人工智能的新路。

中国最早从事人工智能研究的学者大多有数学和数理逻辑背景,吴文俊、金岳霖、胡世华、王湘浩、吴允曾等人工智能的前辈都是数学家或逻辑学家,他们的弟子很多,对我国人工智能的发展有深远的影响。但是人工智能的核心是算法(algorithm),而中国对算法的研究起步较晚。在20世纪90年代以前,中国的书店里只有“计算方法”教科书,算法方面的书极少。所谓“计算方法”,实际上是讲数值分析(numericalanalysis),与计算机科学中的算法不是一个概念。1995年,李明和堵丁柱在中国创办了计算与组合学国际会议(COCOON),为我国推广算法研究作出了重大贡献。2004年,姚期智先生回国以后,举起了算法的大旗,培养了一大批从事算法研究的学生,中国的算法研究开始出现蓬勃发展的新局面。我们要正视中国算法研究基础薄弱的短板,只有高度重视算法研究,人工智能研究才不会偏离主流。

解决人工智能的重大应用问题需要算法、模型、软件和系统结构的密切配合。我的博士论文题目是《组合搜索的并行处理》,研究内容既涉及算法又涉及计算机体系结构,我回国以后延续了这一传统。我指导的博士姚新后来又指导了中国科技大学的陈天石,他和他的哥哥陈云霁,一个做神经网络算法,一个做芯片设计,在国际上率先推出了神经网络机器学习芯片“寒武纪”,体现了算法与系统结构密切配合的优势。1991年9月17日在北京召开的全国第一次人工智能与智能计算机学术会议上,我代表“863-306”主题专家组在国内第一次提出了“顶天立地”的战略口号,指出当时的智能计算机只处于初级阶段。30多年过去了,我现在仍然认为智能计算机还处在初级阶段。ChatGPT等语言大模型的出现是联结主义技术路线的巨大成功,但还只是相当于20世纪40年代的电子管计算机,其能耗之大令人无法忍受。大模型的困境从低功耗的角度说明传统计算机结构已快走到尽头,必须有类似晶体管和集成电路这样的重大发明,智能计算机才能走上广泛普及的道路。

近十年来,联结主义攻城略地,所向披靡,深度学习大模型的巨大进展和不可解释性引起了人们对人工智能基本问题的反思,令我想起1991年1月《人工智能》期刊关于人工智能基础的一场大辩论和1992年夏天在智能中心举办的“AISummerSchool”。本书第14章讲述了这场具有历史意义的大讨论的来龙去脉。在整理旧物时,我发现了一篇自己未正式发表的文章——《Al理论研究的方法论问题》。这是1992年我和白硕为智能中心内部出版的有关人工智能理论问题的论文集写的序言。这篇文章指出:“几十年来,AI研究之所以走过不少弯路,除了其本身的困难性外,研究方法与指导哲学上也存在问题,值得我们反思。迄今为止,在AI研究中使用的主要方法还是唯理性主义和简化论,这类方法曾在自然科学领域取得辉煌成功,但未必适用于AI研究,因为AI的基础是思维科学,其研究对象与研究方法和一般的自然科学不同,必须有方法上的创新。”希望人工智能界摆脱传统思想的束缚,从更高的维度看待“不可解释性”和“可言传性”,化解对人工智能的恐惧,将人工智能引上良性发展的轨道。

我国在人工智能领域发表论文的数量已经达到世界第一,但大多数还是跟踪式的研究。渐进式的跟踪研究也是有价值的,因为随大流的研究可以形成一个科研群体的高原,而只有在高原上才能形成“一览众山小”的世界高峰。按照库恩的科研范式理论,范式是在某个学科内从事科学研究的一套基本完善的规则和行为标准,或者说,是做研究的“官方”途径,遵循范式做研究可以得到资金和荣誉,大多数科研工作者为了生计难以摆脱范式的束缚。但是,科学的进步是一次又一次范式的改变完成的,带头实现范式转变的往往是一些眼光超群又坚持不懈的年轻人,他们不按常理出牌,最终会引起同行学者信仰的变化。目前人工智能界很流行所谓SOTA刷榜,即将标准测试的性能提高一点点,赚取一次世界领先。这样的研究工作难以实现范式转变,应当鼓励更多的学者从事有趣的非主流范式的研究,追求未来在性能和能效上取得数量级的进步,而不计较起步时的性能低下。范式转变往往是长期努力的结果,辛顿从20世纪80年代初开始探索深度神经网络,坐了30年以上的冷板凳。我们要探索更节能、更安全的人工智能新路,至少要有面壁20年的思想准备。

本书是一本值得认真阅读的好书,它为我们展示了中国第一代人工智能研究者们筚路蓝缕的艰苦历程。以史为鉴,可以知兴替。历史的经验教训弥足珍贵,历史可以照耀未来。衷心希望年轻的科技工作者可以继承老一辈学者的优良传统,提升科学研究的品位,开创人工智能研究和产业发展的新天地。

(作者为中国工程院院士、中国计算机学会名誉理事长;本文为《中国人工智能简史》一书推荐序)

责任编辑:方凤娇 主编:程凯

查看更多华夏时报文章,参与华夏时报微信互动(微信搜索「华夏时报」或「chinatimes」)