人工智能相关技术研究与发展
- 作者:
- 安徽新天源建设咨询有限公司
- 最后修订:
- 2020-07-04 09:18:39
摘要:
目录
主要专家简介:
展开
【简介】
人工智能(AI — Artificial Intelligence)是研究用计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的一门新的技术科学,是计算机科学的一个分支。它的目标是使计算机完成类似人类智能的工作,实现更高层次的应用。近年来人工智能技术有了很大发展,世界上一些主要大国都把人工智能纳入国家战略给予高度重视。2015年,我国制定的《中国制造2025》制造强国战略中,“智能制造”被定位为中国制造的主攻方向。2017年,国务院印发的《“互联网+”行动指导意见》中,人工智能领域被列为重点发展领域。人工智能技术成为国际竞争新的制高点。本次沙龙讨论了人工智能的发展现状和未来的发展展望,为人工智能的研究和发展提出了建议。
【主持人致辞】
赵永涛:今天的沙龙是我们成都分院老科协举办的第五次学术沙龙,主题是“人工智能相关技术研究与发展”。人工智能是当前一个热门话题,我们邀请了中科院成都信息技术股份有限公司(原中科院成都计算所)刘绍中研究员作主旨报告。刘绍中研究员长期从事计算机技术的研究开发,对人工智能有深入研究。我们还邀请了川大、西南交大、电子科大、西南民院等单位人工智能研究领域的老师,希望大家进行交流讨论。今天参加沙龙活动的还有院离退休干部工作局、院老科协的有关领导以及省老科协、分院的有关领导,我们表示热烈欢迎。下面有请刘绍中研究员作报告。
【主旨报告】
刘绍中:人工智能相关技术研究与发展
一、从AlphaGo(阿尔法狗)谈起
AlphaGo是人工智能里程碑式的进步。近年来人工智能给人们带来的冲击,莫过于AlphaGo战胜世界围棋大师的事件。AlphaGo是一款计算机下围棋的程序。大家都知道,围棋的棋盘是一个由纵横各19条线组成的正方形网格,共有361个格点。它的规则很简单:对弈双方分别持黑白棋子,黑子181枚,白子180枚,共361枚;双方轮流把棋子落在棋盘的格点上,落子后不能移动,如果一方的棋子被另一方的棋子围住,即为“死子”,可以被提走。这样下去,直至局终,以盘面上的活子围地多少来定胜负。
为了写出计算机下围棋的程序,需要进行一些形式化处理。我们把棋盘定义为一个“类”,棋盘上每个格点的“状态”用一个三维数组表示,前两项定义格点的坐标位置,第三项定义当前格点的状况(黑、白、空)。再把棋盘上内部连通的格点集合且集合中格点具有相同状态(黑、白)定义为棋盘类的“子类”。子类的实例就是围棋的块。块中不完全与其块内格点连通的格点是块的边界格点。边界格点要不自己就是棋盘边界,要不就是与它相连的外部与块本身对象颜色不同的格点(另外一种颜色、或空),如果所有与块相邻的外部格点都是另外一种颜色的话,那么这个块就没气了,就死掉了。所以可以定义它的几个操作。块的连通或“增操作”就是要把它增加或者合并。如果它被吃掉了,定义它的操作就是颜色变成空了,黑的变成空的或者是白的变成空了。
由于围棋的规则并不复杂,一般说来,一个初等的程序员就可以写出一个围棋游戏的程序。问题在这儿,如果要机器下围棋,如果不计算死活,一方一步,围棋的状态空间是361的阶乘这样一个数量级。如果是加上下棋过程中被吃掉的,被替掉的块,状态空间的数量级还要增加很多,它的数量实在太大了。我们平时下棋实际上就是在这样一个大的状态空间去搜索它的路径,从一个状态到另一个状态、现在这个状态和下面一个状态的搜索。我们知道以前在搜索的时候,采用的是广度搜索和深度搜索(所谓暴力搜索)。现在这么巨大的量,如果完全是暴力搜索方式的话,肯定是处理不了的。怎么样减少它的搜索呢?人们在几千年的博弈历史中,总结了很多经验性的知识,比如棋谱、比如定式、比如各种棋经之类等等。棋手就是参考这些知识来判断局势、帮助自己做出路径设计。
图1 围棋
1997年,IBM的深蓝(Deep Blue)跟卡斯巴罗夫下国际象棋,深蓝就是以这样的巨量暴力搜索形式,取胜了卡斯巴罗夫,而且赢得他心服口服。当时我们认为人工智能搜索方式是:它总结所有国际象棋的棋手经验,在此基础上来进行启发式的暴力搜索,也就是在已有的知识基础上进行搜索。
而现在的AlphaGo,我们看到是另外一个方式。它与李世乭对弈的时候,下到第四盘输了。当时国内的棋手界,包括聂卫平后来评价说,这个棋是多少台机器在运算,其中有一台机器断电了,因为不像是机器在其余几盘中应有的水平。给李世乭下的是AlphaGo-Lee,这个版本是建立在两个神经网络的基础上,一个策略网络,还有一个是评价网络。一个网络评价输赢的概率。然后另一个网络来决定它下一步怎么走。
后来出了一个改进版本,叫AlphaGo-Master,与柯杰下,完败柯杰。Alpha-Lee和李世乭下的时候,说它输入了很多既有的知识。但是到AlphaGo-Master的时候,它已经基本上完全不需要前面的知识了。
当AlphaGo再升级的时候,叫AlphaGo-zero,AlphaGo-zero是什么呢?它自己跟自己下,开始它只知道围棋的规则,它完全没有围棋所有几千年累计的知识,完全没有。它就自己同自己下,很快它就掌握了我们几千年的知识,AlphaGo-Zero显示的就是自学习功能,它自己学会了怎么样积累围棋的知识。
棋谱是几千年累计下来的,AlphaGo-Zero完全不知道,它通过自学习就学会了,太厉害了,所以我觉得它给我们带来一种全新的考虑。我们以前做程序的时候都知道,要让程序灵活的话,可以用参数来改变它,让它自己在运行过程中修改参数。AlphaGo不仅修改参数,而且还修改神经网络本身。AlphaGo-Master和AlphaGo-zero只用围棋规则作为输入,一点也没有用其他的围棋知识输入。
AlphaGo-master还包括了少量的设计者掌握的知识特征。AlphaGo-zero不用这些知识,随机地扔几个棋子下去,看它的结果。它是先来评估,评估当前的状况是什么样的,再来预测下一个落子的位置。它在运行的时候,AlphaGo根据它应用的对象,然后积累对象的知识,这很厉害。算法定了,AlphaGo神经网络就已经有了,它也用这个神经网络来计算别的东西。前几天才公布的一件成果,他们用Alpha-Fold 来预测蛋白质的空间结构,3维空间的折叠,就是用这个算法来做的。这个算法与物理的东西没有关系,跟蛋白质的空间折叠的物理基础没什么关系,它用这个算法来做,非常让人震惊。
总结一下:在AlphaGo-Master基础上,DeepMind利用了一种新的强化学习方式,开发了更进一步的AlphaGo-zero。AlphaGo-zero 自己成为自己的老师。从一个对围棋游戏完全没有任何知识的神经网络开始。通过将这个神经网络与一种强大的搜索算法相结合,就可以自己和自己下棋了。在它自我对弈的过程中,神经网络被调整、更新,以预测下一个落子位置以及对局的最终赢家。
这个更新后的神经网络又将与搜索算法重新组合,进而创建一个新的、更强大的 AlphaGo-zero 版本,再次重复这个过程。在每一次迭代中,系统的性能都得到一点儿的提高,自我对弈的质量也在提高,这就使得神经网络的预测越来越准确,得到更加强大的 AlphaGo-zero 版本。这种技术使得它不再受限于人类知识的局限。相反,它可以从一张白纸的状态开始,从世界上最强大的围棋玩家AlphaGo 自身进行学习。
AlphaGo-zero与之前的版本不同的是:
AlphaGo-zero只使用围棋棋盘上的黑子和白子作为输入,而之前版本的的输入包含了少量人工设计的特征。
AlphaGo-zero只使用一个神经网络。之前的版本使用两个神经网络,一个是“策略网络”(policy network),用来选择下一个落子位置;另一个是“评价网络”(value network),用来预测游戏的赢家。在AlphaGo-zero 中这些是联合进行的,这使得它能够更有效地进行训练和评价。
AlphaGo-zero不使用“走子演算”(rollout)——这是其他围棋程序使用的快速随机游戏,用来预测哪一方将从当前的棋局中获胜。相反,它只依赖于高质量的神经网络来评估落子位置。
在进行了三天的自我训练后,AlphaGo-zero在100局比赛中以100:0击败了上一版本的 AlphaGo——而上一版本的 AlphaGo 击败了曾18次获得围棋世界冠军的韩国九段棋士李世乭。经过 40 天的自我训练后,AlphaGo-zero变得更加强大,超越了曾击败世界上最优秀、世界第一的柯洁的AlphaGo-Master。
在经过数以百万计的自我对弈后,从零开始,Alpha-zero在短短几天内积累了人类数千年积累的知识。Alpha-zero也发现了新的知识,开发出非常规的策略和创造性的新下法,这些新下法超越了它在与柯洁和李世乭比赛时发明的新技巧。DeepMind 联合创始人兼 CEO Demis Hassabis 评论称:“AlphaGo短短两年里取得了如此令人惊叹的成果。现在,Alpha-zero是我们项目中最强大的版本,它展示了我们在更少的计算能力,而且完全不使用人类数据的情况下可以取得如此大的进展。
二、人工智能(AI)技术的回顾
我们来讨论一下人工智能发展过程中间涉及到哪些技术,以前我们做过一些什么事。
1. 专家系统
我记得以前有一段时间“专家系统”很流行,现在好像不太时兴了。1982年在我们所,朱学曾和中医学院搞了一个中医痺症的专家系统,后来我们在1982巴基斯坦伊斯兰堡“The 7th nassalgali international summer college on physics and contemporary needs”会议上,公布了我所开发的中医痺症专家系统。现在看来它就是一个简单的if…then…的判别程序,其中判别条件就是预先设定的专家的知识。
专家系统主要研究:怎么收集专家知识,怎样把专家知识把它表达出来,知识表达方式,怎么样存储,怎么检索。当时专家系统就包括知识库,知识库。知识表示方式有产生式规则、语义网络、框架、状态空间、逻辑模式、脚本、过程、面向对象等。基于规则的产生式系统是目前实现知识运用最基本的方法。主要就是专家的知识怎么样进去,就是把专家的知识数字化。我们做了很多这种项目,让专家对某一个问题打分,完全把它数字化,然后把专家的设计到的各方面的东西集中起来,用数学的方法找出最优的结果。
专家系统通常由人机交互界面、知识库、推理机、解释器、综合数据库、知识获取等6个部分构成。
其中推理机(又称规则解释器)的任务是运用控制策略找到可以应用的规则。推理机针对当前问题的条件或已知信息,反复匹配知识库中的规则,获得新的结论,以得到问题求解结果。推理方式可以有正向和反向推理两种。正向链的策略是寻找出前提可以同数据库中的事实或断言相匹配的那些规则,并运用冲突的消除策略,从这些都可满足的规则中挑选出一个执行,从而改变原来数据库的内容。这样反复地进行寻找,直到数据库的事实与目标一致即找到解答,或者到没有规则可以与之匹配时才停止。逆向链的策略是从选定的目标出发,寻找执行后果可以达到目标的规则;如果这条规则的前提与数据库中的事实相匹配,问题就得到解决;否则把这条规则的前提作为新的子目标,并对新的子目标寻找可以运用的规则,执行逆向序列的前提,直到最后运用的规则的前提可以与数据库中的事实相匹配,或者直到没有规则再可以应用时,系统便以对话形式请求用户回答并输入必需的事实。
2. 大数据
AI的另一技术基础依赖大数据。大数据怎么来的呢?最早我们所里搞关系数据库(32位微小型机上的关系数据库,获得四川省软件一等奖),是定义和管理早期结构化数据的数据库。以后发展到现在的大型关系数据库,起初数据库只能处理同源的结构化的数据,以后扩展到异构的结构化数据。再以后由于处理多媒体信息和网络数据的需要,进入网络多媒体数据库、数据仓库、……的时代,数据存储、检索、挖掘和分析的技术获得飞速发展。
数据检索,就是给一个条件,然后从数据库找出来满足这一条件的数据。后来到网络数据的时候,网络数据和非结构化的数据,比如说文本、图像这种数据的时候,这种数据检索就发展成了数据挖掘。实际上我们在网络检索数据时就是发出很多代理,发到网上,让它去找相应的数据。到网络数据的阶段,就给非结构化的数据与提供了很大的空间的。
大数据现在的定义需要新的处理模式,需要更强的决策力、洞察发现力和流程优化的能力来适应海量的高增长率的多样化的数据信息。多样化的信息资产包括结构化的数据,非结构化的数据,还有图像、声音等各种媒体。什么结构的信息都能够检索,而且都是在网络上面数据。这种数据的检索在挖掘的过程中间,就会产生很多新的知识,比如最早的数据挖掘,在挖掘数据的过程中,发现信息之间有一些以前你不知道的关联性,关联规则。一个著名的例子,男的到超市去买东西,啤酒和尿布的关联就是在挖掘过程中发现的。这个关联规则的发现就是产生知识的来源,不断产生新的知识。所以大数据是我们新的知识的来源之一。从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。大数据通常用来形容一个公司创造的大量非结构化数据和半结构化数据,大数据分析常和云计算联系到一起,实时的大型数据集分析需要建立有效的框架来向数十、数百或甚至数千的电脑分配工作。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。
由于大数据技术的发展,各类以前看似完全不搭界的事物潜在的关联、规则正在不断的发掘出来,新的知识正在不断发现。
3. 神经网络
还有一个AI的重要技术就是神经网络。原理来自动物的神经系统,输入相当于给系统一个刺激,然后根据神经的生理模式的模拟它的刺激传递方式,离它远的地方,神经源对刺激的反映就要弱一些,一直到最后得到一个输出。根据你现有的知识,对它进行训练,然后让它能够符合人在遇到问题的时候的判断方式,让它更能符合实际,这就是神经网络的大概原理。
更严格的定义应该是:神经网络(Neural Networks,NN)是由大量的、简单的处理单元(称为神经元)广泛地互相连接而形成的复杂网络系统,它反映了人脑功能的许多基本特征,是一个高度复杂的非线性动力学习系统。神经网络具有大规模并行、分布式存储和处理、自组织、自适应和自学能力,特别适合处理需要同时考虑许多因素和条件的、不精确和模糊的信息处理问题。神经网络的发展与神经科学、数理科学、认知科学、计算机科学、人工智能、信息科学、控制论、机器人学、微电子学、心理学、光计算、分子生物学等有关,是一门新兴的边缘交叉学科。
神经网络的基础是神经元。神经网络模型是以神经元的数学模型为基础来描述的。人工神经网络(Artificial NuearlNewtokr)是对人类大脑系统的一阶特性的一种描。简单地讲,它是一个数学模型。神经网络模型由网络拓扑.节点特点和学习规则来表示。神经网络是一个高度非线性动力学系统。虽然,每个神经元的结构和功能都不复杂,但是神经网络的动态行为则是十分复杂的;因此,用神经网络可以表达实际物理世界的各种现象。
人工神经网络的模型现在有数十种之多,应用较多的典型的神经网络模型包括BP神经网络、Hopfield网络、ART网络和Kohonen网络。下图是一种简单的线性神经网络模型:
图2 线性神经网络结构
4. 自学习
学习是神经网络一种最重要也最令人注目的特点。在神经网络的发展过程中,学习算法的研究有着十分重要的地位。目前,人们所提出的神经网络模型都是和学习算法相应的。所以,有时人们并不去祈求对模型和算法进行严格的定义或区分。有的模型可以有多种算法。而有的算法可能可用于多种模型。在神经网络中,对外部环境提供的模式样本进行学习训练,并能存储这种模式,则称为感知器;对外部环境有适应能力,能自动提取外部环境变化特征,则称为认知器。神经网络在学习中,一般分为有教师和无教师学习两种。感知器采用有教师信号进行学习,而认知器则采用无教师信号学习的。在主要神经网络如Bp网络,Hopfield网络,ART络和Kohonen网络中;Bp网络和Hopfield网络是需要教师信号才能进行学习的;而ART网络和Khonone网络则无需教师信号就可以学习。所谓教师信号,就是在神经网络学习中由外部提供的模式样本信号。
神经网络的算法与传统的问题求解方式完全不一样。我们经典的处理问题的办法,比如说我们处理力学的问题,首先根据物理定律(牛顿定律),和介质材料的性质,建立物理模型。然后就可以推出一大堆公式,建立数学的模型,最后求解。但是神经网络求解方式就可能就跟物理模型没关系,完全是一个数学的试探过程。我们以前几百年来的求解方式是把所有的影响因素逐步孤立化,比方说力的因素、电的因素,把它分开来建立它的模型,最后才来汇总综合考虑整体的影响。然而现在AI解决问题的方式就可能不是这样了。现在是把所有的影响的因素、约束条件、目标需求数字化。比方说电流,从一安到多少安,反正按电流的因素把它数字化。然后力学的因素,光学的因素,或者别的什么因素全部数字化以后,就变成一个很多维的状态空间。所以问题求解就是在这样一个多维的状态空间去搜索寻找它的满足条件的结果。而这样的状态空间中,相关的因素(即其中某些维)跟物理模型隔得有点远了,有的可能有严格的物理模型、也可能只有一些经验的数学模型、甚至只有一些零星的参考数据。AI就可以在这样的状态空间中,通过搜索、评估、预测来进行路径探索,最终向与其结果逼近。就像AlphaGo现在这样。AlphaGo做蛋白质的空间折叠跟下围棋一样,用基本类似的一个网络Alpha-Fold在做。很奇怪的,我也不知道我们将来会不会也有类似的这样一个结果。
以AlphaGo-zero为例,其自学习机制可以描述为:
AlphaGo-zero 的神经网络使用自我对弈数据做训练,这些自我对弈是在一种新的强化学习算法下完成的。在每个位置 s,神经网络 fθ都会进行蒙特卡洛树搜索(MCTS)。MCTS 输出下每步棋的落子概率 π。这样搜索得出的概率通常比神经网络 fθ(s) 的原始落子概率 p 要更加强一些;MCTS 也因此可以被视为一个更加强大的策略提升运算。这一新的强化学习算法的核心思想是,在策略迭代的过程中,反复使用这些搜索运算,神经网络的参数就不断更新,让落子概率和评价 (p,v)= fθ(s) 越来越接近改善后的搜索概率和自我对弈赢家 (π, z)。这些新的参数也被用于下一次自我对弈的迭代,让搜索越来越强。
这里的自学习功能表现为:1、数据和算法参数的自动更新;2、策略的迭代和更新。显然策略更新还有更多的想象空间。
一般而言,常规神经网络的学习功能包括:三层神经网络、K近邻、Adaboost、贝叶斯、决策树等常规方法。深度学习方法包括:深度置信网络、卷积神经网络、受限波尔兹曼机、循环神经网络等。此外,常见的涉及利用既有知识的算法还有:迁移学习、主动学习、演化学习等。
三、AI未来发展展望
下面讲一点我们对AI的一些展望。
1. 新知识的产生
1)完全依靠公理和逻辑推理的科学领域未来将可能没有人类领先的空间。数学就是这样一门科学,数学的基础建立在一系列公理之上,通过逻辑推理向各个方向无限延伸。构成数学推理的语言是一套符号运算系统,在基本公理的基础上,人们可以依靠逻辑递归地推导出一系列毋庸置疑的结论。按照哥德尔不完备定理,通过添加任意多与之前的公理独立且自洽的公理,就可以得到更多全新的知识。建立在公理系统的逻辑推理的领域,就是一个符号系统,它的所有的符号推理的东西,比如说我们杨路老师以前搞过多项式的辨别式,给出了任意多项式的判别式,建立在一个新的符号系统基础上。该符号系统除了+、-、×、/,它加上了一个程序判别。AlphaGo-zero三天的自我训练得到的围棋知识就远远超过了人类几千年得到的围棋知识。可以想像,如果我们建立了一个公理系统和逻辑推理规则,将会有机器来自动产生所有的推论。很难的问题,它都会给你推出来。将来肯定是这样的。因此在这些领域,未来将可能没有人类领先的空间。
2)大批跨领域的新知识将不断出现。几千年来的实证科学研究方法,讲究尽可能研究单一因素对结果的影响,在此基础上考虑各种可能的影响。所以在很多领域需要根据物理定律建立数学模型,进而求解。而AI提供了以前看似完全无关领域的关联研究方法,使用的方法就是搜索、评估、调整等看似与物理模型关系不强的方法,却可以得到相对最优的结果。我们以前学应用数学的时候,首先我们要把方程列出来,再把它的数据解求出来。现在不是这样的,现在就是把这些可能的这些因素数据化,然后去搜索,全部一个点一个点去找它的结果,这个跟我们原先的方程不一样了。
3)由于计算机的信息可以永久储存,所有的既有的知识将永久存在,不再需要重新发现。这会对人类的学习和创造新知识产生巨大影响。
4)由于AI系统的广泛应用,由此将产生大量新的符号系统。这意味着人类的知识系统会产生巨大变化。
5)语言、文字、及所有的人类交流方式将出现根本性变化。比如,据说脸书定义了一种语法和简单的单词,让AI系统自己在类似实际的环境中进行训练。最后产生了一种谁也不懂得语言,吓得开发者赶快拔电源关机。
2. 新方法的产生
1)新的符号系统及符号运算方法。这是必然的趋势。
2)新的趋势评估方法 。以前我们评估趋势的方法是生成一个曲面,然后在曲面上面找这些点。现在不是这样,这个点比这个点高,我们就往这个方向走,这个点比这个点低,我觉得这个方向我就放弃了,或者说几个点它的梯度什么的,它前进的方向不一样。它的路径,搜索的路径不一样。
3)新的路径搜索算法。就是怎么样使你搜索的路径优化,减少你的无效的搜索,还有就是你的算法的并行性,尽量并行处理。
4) 新的优化算法。算法的框架和参数的迭代优化,这个优化过程,这个是从AlphaGo-zero来的,它在自己学习过程中间,会把它的参数,甚至框架都优化了。我觉得现在还没看到我们这个领域里面有人在做这个东西,怎么样去把整个框架迭代优化,AlphaGo就做这些。可能这个东西涉及到它的技术秘密,但是这个东西是很有意思的,不光是参数优化。
5) 跨学科领域的综合集成算法。由于神经网络本身并不去祈求对模型和算法进行严格的定义或区分。有的模型可以有多种算法。而有的算法可能可用于多种模型。而采用神经网络对于现有的各类模型和算法进行评价显然会产生新的方法。
3. 新的应用
新的应用会很多,这里举一些例子:
1) 自动驾驶。新应用第一个方面就是自动驾驶。自动驾驶现在很热,实际上飞机的自动驾驶肯定是最成熟的,民航飞行员上天以后基本上不再人工驾驶了,都是自动驾驶。它的环境是相对要简单一些。汽车的自动驾驶的环境要复杂一些,要估计许多其他的环境因素,人工智能就是专门处理这些问题的。比方说路边有一个人,你图像采集到了,他站在那儿,他有一些什么动作,你就能够估计出他的下一步动作,这个就是AlphaGo的用法。原先觉得这个很难,现在看起来还会出问题,肯定最终会把这个问题处理好。
2)自然语言理解。新应用的第二个方面是自然语言的理解和翻译。原先觉得这是很难的,现在已经有非常大的进步了。一般的自然语言,AI不但能够理解,能够越来越细腻的理解,原来它要求很标准的输入,它现在能够理解到你很独特的口音。你的表达的很细微的地方它会找出来,这种表达和那种表达的中间的差别也会找出来,这是发展方向。而且现在实用的东西已经很多了。
3)基因的研究。现在这个比较热,尤其是国外很热门,我目前还不清楚我们中国怎么样。最近我看到很多材料,生物医学的靶向治疗已经精准到必须要跟你基因进行匹配,原来的靶向治疗根据你的病的位置来确定它的靶向,而现在它要精确到你的基因,用AI分析你的基因来确定你的靶向,这个是很厉害的,一家波士顿的医疗研究机构在进行这方面的临床研究。当然现在很贵,它要去分析你的基因,这是生物技术的尖端科技应用。
4)语言、文字、及所有的人类交流方式将出现根本性变化。现在人类文明所有的东西,包括语言,包括文字,包括各种文物的东西,将来都会数字化。数字化以后,各种文明因子就变成了数字因素,加上时间的因素,就会构造一个文明的进化图。据此是否可以算出目前是不是最优的?它中间还包含了一些其他的东西,肯定可以研究出很多东西来,这就是一个人类的文明的进展密码破译过程。
5) 各种智能决策支持。以前我们是决策支持系统,决策支持系统是什么呢?我提供决策的数据支持和方案,制定一串方案以供决策者选择。而现在能够自动决策。像AlphaGo决策完全是自动的,不用人来选择的。
6) 信用系统的全覆盖 。区链块和AI技术的发展将最终可以使每个人的价值完全由个人信用决定,完全由算法提供保证,与任何其它人为因素无关。
7)情绪的数字化。情绪表现在你的人的肢体的语言,你的面部表情,这些都可以数字化。数字化就可以判断你的情绪,情绪细化到什么程度,表示你这个人是一个什么情绪状态。人和机器的关系都可以把它细化到那种程度,人与人之间的关系,通过你自己肢体的语言全部数字化以后,全部细化了以后,你可以研究出你这个人你的喜好,或者你对它的这种感觉什么的,都可以让机器算出来,这个挺可怕的。
4. AI发展带来的思考
情绪表达的数字化。当所有外在的知识表达都可以由机器获得以后,自然人的情感是否可以由其外部表现(比如面部表情、姿态语言、所处环境、等等)的数字化完全表达,这成为AI的终极问题。一些数学家认为人类具有“直觉”,而计算机没有,所以计算机永远不可能具有人脑的能力。人工智能无论如何发展,也无法具备人类的智慧。但另外一些研究指出人类思维也是不完备的,人脑的“思考”和电脑的“运算”基本原理一致。这种相似的联系直接导致人脑的思考也是符合哥德尔不完备定理的条件的,因此人类的思维系统也是不完备的。
电脑用电子元件的“开、闭”和电信号的传递,人脑则相应表现为神经原的“冲动、抑制”和化学信号的传递。在生活实践中,人们是通过思考来建立对世界的客观认识和描述的,而语言则是人们彼此交流思考结果的有力工具。对人脑而言,思维推理系统的不完备也就意味着存在不能用思维证实的题。简而言之,现实中总有那么一些问题或者想法,我们无法用思维来证实或者否定它,从而也就无法用语言来完全准确的表达我们的思想。由于思维是客观实在的近似反映,语言则是思维的近似表达。这就是我们“只可意会、不可言传”背后的数学原因。
人工智能的发展将带来人与人的关系、人与机器的关系深刻的变化,将对人类社会的发展产生巨大影响。现在人工智能已经可以在许多事情上超过人类,可以在许多工作上帮助或是取代人类,为人类造福;但是它的发展也带来人们对AI安全和未来走向的担忧。因此,人工智能伦理的问题已经引起学界和政府的高度关注。
这是从AlphaGo出来以后,我对人工智能的一些想法和感觉。有人说人工智能是不是开启了什么魔鬼,打开魔鬼的瓶子,放出了什么东西来?谁知道呢?人工智能可以将人的所有的东西模仿出来,包括人的智慧、情绪,人类的表达……人工智能是未来发展的必然趋势,但是人工智能最终将要走向哪里,是值得大家思考的问题。以上是我的一些体会,希望大家觉得有兴趣的话一起研究讨论。谢谢!
【讨论与交流】
赵永涛(主持人):刘教授从人工智能的概念和技术,以及发展前景三个方面给大家作了精彩的报告。下面我们请大家讨论。
彭德中(四川大学):人工智能现在已有广泛应用。一个例子是核磁共振的影像资料的识别。新生儿视网膜病变是一种常见病,新生儿早产了,要放到氧舱里面,后期发育会对他的视网膜产生影响,可以通过核磁影像来识别。现在我们全省能够做这件事的医生并不是很多,主要集中在华西和省医院。在很多边远地区,虽然有这样的影像的设备,但是它识别不了。我们通过一个神经网络就能够进行影像资料的识别,能够判别出视网膜病变。
在视频的监测和识别方面,我们和中科院光电所合作,用神经网络做了无人机的识别。我们用视频实时地进行监测、跟踪,然后判别它的类型,识别哪些地方是电池,哪些地方有故障,对故障进行定位。
在自然语言处理方面,我们做了客户机器人,可以根据用户的问题,判断他的意图,识别他的情感,然后自动生成一个回答,而不像以前进行抽取式的回答。这种应答对客户更为友好,能够更准确地理解用户的意图,取得很好的用户体验。
我们在人工智能解决实际问题时也遇到一些问题,最主要的就是小样本学习。例如在无机人的探测和识别中,由于各种空管限制,无人机多次都不能飞。我们只好在大厂房里面让无人机试飞,利用多部摄像机捕捉它的影像资料,为机器学习提供素材。
现在神经网络被看成一个黑盒子,输入被映射到输出上,它是怎么进行影射的,它是怎么进行工作的,目前还有许多理论问题有待探讨。AlphaGo是一种机器博弈,但是它属于具有完备性系统的博弈,就是我可以看到对方的牌,对方的棋谱是怎么样的。还有一种博弈,非完备信息的博弈,就像打扑克打麻将,我不知道对方手上是什么样的牌,下什么样的局。在这种情况下像兵器推演,像在电子空间对抗里面,很多时候都涉及非完备信息的博弈。所以目前一个主要研究对象就是针对新一代的神经网络针对小样本学习,非完备信息博弈。
吴 晓(西南交大):刚才刘教授已经说了,人工智能发展比较好的,第一个是自然语言处理。现在的问答机器人,其实是在智能回答。问答机器人首先需要语音识别,科大讯飞的语音识别已经做得很好了。其次是机器人的机械手臂监测等等,包括图像和视频,包括现在的摄像头,这块儿的需求非常强劲。刚才彭老师说了医学图像处理,包括辅助的智能医生,还包括智能像阅读这些,其实已经有很大发展,所以很多技术已经实用化了。
存在的主要问题,许多是数据样本的问题。刚才彭老师也说过了,许多异常事件都是小样本,包括监控的视频。在深度学习的过程中,缺少样本,就造成一系列的问题,造成了不准,出现了误报。另外是小目标的问题。在监控视频里面,有很多是小样本,在监控过程中还有其他一些抖动,都可能造成我们的准确性下降的问题。
在深度学习中,还有一个科学问题是,对我输入问题最后得出的结果,我无法判断为什么这个结果好,为什么这个结果差,为什么我们不能解释它,原因在哪里?人工智能还有许多问题的研究,包括图像生成技术,原来没有样本,我们可以自动图像生成。但是这个技术怎么用,能不能弥补样本比较少的情况,我们还不清楚。
符红光(电子科大):在座很多都是我的老领导。最近几年,我跟张景中院士研发高考机器人。当前这次人工智能的浪潮主要是靠数据推动,算法推动。整个世界本质是数,数据的重要性是基本的,只要你有数据你就会有发展前景。中国和美国人工智能的优势在于数据和计算能力,两国都很强。但我们的计算能力的芯片还是用国外的,我们目前的算法还有差距。这次人工智能浪潮主要靠数据和算力推动,机器实际上没有懂意思。下一步竞争的制高点在认知智能,像人一样学会学习,要学会逻辑推理,不仅仅是模拟。现在的神经网络还是模拟,但是已经取得非常不错的效果了。
颠覆性技术不得了,颠覆性技术一出来,以前都不用了。深度学习就是颠覆性技术。以前我们的翻译做了很多,现在深度学习用上后,以前做的都没用了。普通一个大学生都可以做以前非常难的事情。张院士我们团队一直在坚持做认知智能,我们做的高考机器人,让机器参加高考,这几年成绩都是在100多分左右。语文文字表达,叫机器人写作文,由人类来判断。我相信未来竞争还是数据,是0和1,不仅仅再做一个AlphaGo,没意义,我们要在认知智能方面取得突破,首先得突破自然语言。所以有句话叫做“得自然语言者得天下”,谁把自然语言彻底解决了,人工智能就控制住了。
另外刘老师也说得非常好,用AlphaGo预测3D结构。最近我们跟华西重点实验室合作,把深度学习用在基因编辑上,基因优化是基因编辑中的一步,国外有很多在做,包括一些顶级公司。他们以前都是用规则做的,这次用深度学习做,数据一比试,一下就超过了他们。还有化学反应,大家知道的很难的,比方给一个化学物质你怎么做它的反应,新药怎么设计出来做出来,上海的一家公司就是为全球做小分子的生成的,外包,是个大工厂。现在我们有深度学习,机器就可以在很短时间内给你找几十条合成路线,专家判断,准确率已经超过人类专家。人类专家都是行内的专家了,至少是博士以上水平。我们的系统现在已经能达到博士水平,随着数据越来越多,还能进一步提高,因为剩下就是数据问题。我们国家在数据方面积累不够,我非常担心,如果人家真的把数据库一卡,我们就无法工作了。我们国家要抓紧数据建设,数据太重要了,有数据你就好办事了。
王 鹏(西南民族大学):刘教授是我们的老前辈了,今天我听了刘教授的报告,使我非常感动的是他在退休以后还关注着学科的前沿,他在报告里回顾了人工智能的发展历史,对现在的各个热点也进行了展望。我有一个问题想请教一下刘教授。我以前是学物理的,刚才刘教授谈到了优化算法,我们整个团队正在研究优化算法,我们的研究思路是想用以前我们发现的优化算法模型来做,虽然说取得了一些成果,但是我们对这个方向是不是今后能够长期发展,能不能走到一定的高度,我们还有一点点没数。希望刘教授站在战略的高度帮我们把关。
刘绍中:优化算法现在是把问题数据化以后全部是试,看这种算法对不对,不是说给一个概率。原则上是这个概念吧。
王 鹏:量子计算要用概率,用波函数来优化它的算法。
刘教授:整个算法是数字化以后,我找来一个方向,然后计算可能成功的方向,是这样的吧。效果怎么样不敢说。
桂文庄:还是基于物理的规律。纯粹用神经网络,抛掉了物理规律恐怕不行。
王 鹏:非常感谢刘教授。
朱学增:人工智能技术,现在有个趋势是集成。有很多方法,现在都用来研究针对一个问题,现在一个主要的思维是集成的思维。我就想问在座的各位专家,你们有的是专注于针对一个对象用人工智能技术。能不能说人工智能发展到今天已经不是单一的东西,是长远的去开发人的脑力,需要各种人工智能的集成,不是单一,靠单一去带动不行。对不对?
符红光:人工智能有通用人工智能,通用人工智能很遥远,我觉得集成是可以的。比方说符号学派,现在是连接主义,还有控制学,现在做机器人的都是控制学派,人工智能是反馈,现在就是集成的问题。但是不能要求太高,现在人工智能离通用人工智能还很遥远,都是端对端的,没有真正理解。对话机器人,能让它回答你的话,但是它并没有理解你的话的意思,而是纯粹从概率的角度找了一个最匹配你的话,不管你的感受和情感,但是可以通过上下文找到概率最大的结果,所以本质是数据。从应用的角度,比方说翻译机器,涉及到硬件,速度问题,芯片,人工智能计算能力要起来,另外还有很多是逻辑问题。一是深度学习要用,二是传统的规则,传统的图像也可以用,不是说你有了一个深度学习,就像AlphaGo就可以解决很多的问题,AlphaGo解决的问题是边界清晰问题,对边界不清晰的问题,对那些信息非常不对称的,常识的问题,道理非常难的问题,还是没办法。
朱学增:“批量”提高效益,“定制”适应个性,“批量定制”这种生产模式我认为是不管对任何行业都是一个发展趋势。教学也是这样,个性化教育。我想问,人工智能的技术,哪一项能解决“批量定制”?在国外叫组装器,实际上就是讲的平台,我搞一个平台,搞一个开发环境,站在这个开发平台上有一个环境,提供各种数据包和格式,达到的目的不外乎就是功能的集成,数据的集成,过程的集成。任何事情都是这样,不是讲的两个空间状态,有一些操作,一个状态经过一个操作就变了。不是这么简单,比如说网络化,互联网时代的网络,框架早就有了,仅仅是图谱的概念。美国就不讲,就讲组装器。我们国内有没有人搞组装器呢?包括我们的电子科大、川大,你们对组装感不感兴趣,组装就是集成的概念,装备的概念。既然一谈组装,谈集成,谈装备,就必然有拆分,就必然有模块,必然是模块化的,必然涉及到系统工程。
符红光:已经开始模块化了。
左 齐:刘教授讲了很多好的方向,我从应用工作者的角度来补充一下。第一个是关于情感。我觉得现在人工智能在情感研究上面,大家非常关注的是人在情绪上的反应或者说视觉的反应;另一方面,我们很关心舆情里面所包含的情感。我觉得现在自然语言识别里面也是包含两个部分,一个是语音识别,还有一个情感识别。这个舆情到底是正面舆情还是负面舆情?从一段文字里面能不能反应游客的评价?我是搞旅游的,游客的评价到底是好的评价还是差的评价?实际上不是简单根据语音就能够识别,需要通过一些自学习或者一些规则的提取,然后建立新的规则对这个做出一个判断。我觉得这是一个方向。
第二个说到医学,医学里面,我知道加拿大这块儿做得很好,但是他们的电子数据积累了几十年的经验。我非常赞成符教授刚才说的,现在的人工智能是建立在大数据的基础上的。我们国家最重要的问题就是大数据的基础建设。到现在为止,有的地方花了很多钱,实际上并不知道大数据是什么,他们要求数据展示出来的界面,做几个大屏就是大数据,他不知道数据本身。因为没有数据基础,我们现在在医学人工智能上面,不管是临床还是治疗,现在要做的难度其实非常大。我觉得现在有一个方向,特别适合于机器深度学习去做,就是康复训练。界于治疗和常规健身之间的,又要专业性,又要辅助,是一个长期的过程。很多病人偏瘫以后在家康复训练,没有专业支持,我觉得这件事特别适合于人工智能的研究。这个方面我们现也非常关注,因为我们现在做大健康,特别是今后老龄化时代,这种康复训练的需求会越来越大。
第三,我们进入5G时代以后,交通还是一个核心问题。现在景区里面最大的一个问题就是交通和出行。我们在景区上面的智能化投入非常大,但是应用的效果非常差,可以说基本上没有发挥作用,花了非常多的冤枉钱。我们去过很多景区,景区里面最大的关注点,一定要看它的痛点,基本上每个景区的交通都是一个问题,但是感觉好像束手无策。我感觉传统技术做不到,一定要有新技术。这里面我认为交通的引导很重要,这是人工智能能够发挥很大作用的地方。到现在为止,我们所有的交通引导系统都是基于高德、百度,基于大数据做的,实际上计算出来的结果,实时性很差,准确度还不很高。这就是我们迫切的需求。我就补充这三点。
张文敬:我是搞科普的。比如像前不久的《流浪地球》,制作非常恢弘,中国科普科幻的大家们思维非常巧妙,他们的内容试图用很多智能东西。刘教授讲的AlphaGo,对我的启发非常深。我们四川未来准备打造科幻科普大省,准备在新机场附近建立一个具有国际影响力的科幻城。但是目前就我所知道的科普科幻,有很多东西属于魔幻。科幻应该是用科学的东西,用文学的东西写未来的东西,但是我们写的是未来达不到的东西,容易把我们年轻一代引向一些歧途。尽管《流浪地球》票房达到惊人的高度,但是里面的科学不是我们未来所预期的。这里引出一个问题,希望有机会请刘教授团队,还有今天到会的川大、科大等专家,有机会能够为我们四川打造科幻城做些贡献,把中国的科幻和未来的科学结合起来,而不是魔幻的东西。
李荣佳:我提一点建议。我更关心人工智能技术的应用前景和实际应用的案例,比如刚才川大老师提到的,现在的疾病诊断,还有刚才那位说到的现在的些实际应用方面的成效,还有张文静老师提高的信息化的应用。作为学术方面的讨论交流以外,我觉得今后是不是在沙龙内容里面可以注入一些实际应用和应用前景的讨论,以及实际应用反过来对我们人工智能技术的推动。
姚汉民:大家都在搞研究。应用前景在哪儿?现在主攻什么样的目标?这些事情是应该探讨的。现在大家看到人工智能正在进入家庭,各种家庭电器包括电视、洗衣机,都可以有人工智能,这个应用前景是相当大的。各研究所也好,大学、企业也好,肯定是做了很多工作。但是现在要把它深化,要高端化。比如我们光电所,那么复杂的光学技术,光刻机,也有很多人工智能技术,但是现在把它提高,要深化。所以我昨天参加了光电所新班子的讲话,光电技术,光电所今后如何向人工智能发展,创新发展,我觉得现在所长有思路,我很支持这个事情。
朱学增:这种沙龙的形式非常好,希望以后形式要多样化,专业性一定要强,要同行在一起才讲得起来。所以我希望以后我们建立一些联系,有企业的公司,有研究所的人,大家一起讨论。我可以介绍一下斯坦福的企业跟学校的情况,他们的企业跟学校相当紧密,有时企业就提出了很好的意见。所以我希望院里面组织沙龙形式要多样化,专业性一定要强,我们只要一杯咖啡和一个房间,就谈起来了,越谈越有劲。
钟 勇:第一次参加科学院科技沙龙,我谈几点感受:
第一,沙龙体现了我们科学院和科学家的精神,在座的很多科学家不在岗位以后,还在科技领域发挥了重要作用。
第二,我觉得这种沙龙还是非常重要,因为对我们的年轻人和中年人还是有很好现实指导意义。从2017年国家发布人工智能发展规划以后,到今年中国政府工作报告,又把智能+作为重要内容,打造数据经济。我认为这种情况下人工智能已在国家、地方层面全面地爆发,从这个角度上讲我们每个人都离不开。今天的沙龙就有许多别的领域的老教授在场,说明与我们每个人都相关。
今天刘教授的报告做得非常精彩,从AlphaGo这个案例出发,对整个人工智能的相关技术,包括大数据、神经网络、以及深度学习等等做了比较系统的介绍。我觉得非常好。当然从我的认识角度,我也从自己的认识谈点看法。
人工智能发展到现在,新一代人工智能已经不太一样了。人工智能发展到现在有几十年历史了,为什么现在引起大家这样的关注,我想有几个原因:一是是思维模式变了,以前科学研究最多的是机械思维的模式,现在的新模式是数据模式或者大数据思维模式,从数据中发现一些客观规律,包括用数据来表示确定性,用数据关系表示因果关系。现在是用数据来说话,或者用数据发现新知识规律。二是相关技术发生了巨大变化,这里面包括三个方面技术:一个是算力,第二个是算法,第三个是大数据。AlphaGo只是一个引爆点,我认为是这么一个概念,详细的不谈了。从人工智能发展的角度看,人工智能不是一个点,它的范围越来越大,而且是多科学的融合,我觉得这是一个发展趋势。神经网络已经发明很久了,深度学习出现以后,许多事情,包括图像识别的确达到了非常好的效果。例如说人民币识别,用深度学习以后准确率提高了一个级别。这个过程如何理解,实际上就是大数据处理的思维问题。现在人工智能发展已经深入到我们国家社会生活的方方面面,而且产生了一种融合的效果。刚才朱老师谈到一个很关键的问题,集成,我认为实际上是融合。比如说现在工业互联网,不只是单纯的软件,传感等问题,而是多种技术的融合。现在互联网向边缘计算和云计算发展,人工智能、物联网和大数据、智能、理解等等融合以后,就可以解决我们现实生活中存在一些比较大的问题。比如说自动驾驶,现在5G出现了,以后到了6G,自动驾驶就可能广泛应用。比如说,我不会驾车,想到南京去,我小孩又不能陪我,我可以自己驾驶过去。半自动可以完全实现,比如说我小孩在办公室或者家里就可以把那部车开到南京去。传输加快了,我们在车上看到是完全一致的,没有延时,包括医疗和健康,包括办公,家用电器,都有非常好的应用前景。所以人工智能的发展一定对全人类有巨大贡献。
最后,感谢老教授对智能开发、社会服务等等方面的努力,你们的精神值得我们中年或年轻一代学习。谢谢你们!祝你们身体健康!小孩在办公室或者家里就可以把那部车开到南京去。传输加快了,我们在车上看到是完全一致的,没有延时,包括医疗和健康,包括办公,家用电器,都有非常好的应用前景。所以人工智能的发展一定对全人类有巨大贡献。
刘绍中:大家对我报告给了很高的评价,我是关心这个事情,到底不是直接在一线工作,所以肯定很多地方显得很肤浅。在座的专家在第一线工作,考虑问题很深,接触到很深的东西,我也很有启发。谢谢大家!
翟占一:今天的沙龙是一次很好的学习机会,很受益。我也谈点体会。
现在人工智能进入了寻常百姓家,触手可即,我觉得现在已经进入到人工智能的时代,这也是我们科学技术发展到一定时期的一个产物。人工智能是一种集成技术。过去广泛应用于军事、医药,还有科学,现在更多是造福人类,服务我们寻常的百姓。比如说,最近巴黎圣母院发生了火灾,我注意一个细节,火扑灭以后,三分之二都已经烧毁了,但是中楼还保存好了。其中是用了两个机器人,到大楼中间去进行喷洒消灭液,因为人进不去的,也不容易从空中浇水,这样容易破坏文物。
人工智能是造福人类的东西。这里我作为一个消费者提一个建议,我觉得现在人工智能的一些产品接地气不够。我们现在人工智能要说多高端,航母、大飞机、卫星上天都需要它;但是生活中小产品,有一些不接地气,我家里买了个扫地机器人,原来的一款很复杂,除了扫地、吸附灰尘,还可以拖地,但是价格高,不太方便,老年人不会用。后来买的一台机器人很方便,5公分高,可以到你的床下面去扫,但是用了一年就坏了。我最近买了一台,专门去找,我就说要最简单的,就扫地,不要遥控板,不要自动充电,结果几百块,我现在一直用得很好。以前遥控的老人根本不会用,拖地现在还不现实,吸附灰尘很好,吸满了打开盖冲一冲就好。我们的人工智能还是要根据不同消费群体去做,因为中国人口太多了,农村很大的消费市场。我原来地方工作有一家搞洗衣机的厂,它的产品很好,就是瞄准了低端市场农村,简单,能洗干净,而且当时还不是现在触摸式的开关,是按纽,开关就是下面的要粗一些,用2万次就行了,但它用10万次都没问题。所以我觉得还是要接地气,要考虑怎么样服务家庭。当然也要服务我们尖端的科学,但是我们更多的是要搞一些服务大众的,这样我们人工智能技术才能更好地服务社会,更好发挥它的作用。我做过一些调查,我们的大专院校专利很多,但是真正转化的可能不到三分之二,要做好转化这篇文章。我希望我们的科学家能够更多地利用自己的知识去造福社会,去对接社会,让人工智能更多进入我们的寻常百姓家。
桂文庄:今天到这儿来确实学了很多东西,刘教授讲得很深刻。今天来还有一点,使我非常感动,我见了很多老同志,特别是我们的张礼堂老所长,今年已经85岁高龄了,仍然积极参加我们的沙龙。我在这儿谈谈感想吧。
刘教授从AlphaGo开始谈,AlphaGo一出来,全世界轰动,我们中国也是非常轰动。我记得最清楚的是什么呢?有人提出来是不是人工智能快要发展到奇点了?到奇点后,机器人可能会超过人类,不受人类控制,最后把人类消灭了。这个问题带来了人工智能发展会毁灭人类这样一个危险前景,各方面议论很多。这些议论对我们搞人工智能的人来说,第一是这个东西不大现实,因为现在的人工智能和真正人的智能还是有差别。有一些东西它是行的,比方说是由于它可以用非常快速的计算,所以在一些模型之下进行决策判断或者搜索可能比人快很多。但是人还是很特别的,人的智能有些时候是一种顿悟,目前人工智能还没有办法解释和处理。人有一些依靠灵感的事情,人工智能恐怕也很难实现。现在人工智能还不能像人的大脑一样去思考,因为人类还没有明白人的大脑是怎么思考的,你怎么能说人工智能像人一样呢?但是人工智能处理一些事情确实比大脑快。飞机是人学鸟的发明,我们知道鸟的飞行是扑翼,翅膀搧着飞,但是速度比我们飞机差远了。人工智能在某些方面能够超过人,包括下围棋,但是不是全面。所以我认为,在某些点上它会比人强,会有很多发展和应用的前景,会给人带来非常重大的应用,成为人的智能的延伸和补充没有问题。
今天讨论的主题,大家非常关心,是社会热点,同时大家都知道现在人工智能已经上升到国家战略,已经成为世界上先进国家之间竞争的一个制高点了。过去咱们提互联网+,现在咱们讲人工智能+,就是说人工智能要应用到各种各样的领域去,促使我们各种各样的处理模式发生颠覆性的变革,使得我们能够在各种领域里面上一个新层次。我觉得人工智能的重要性在这儿。所以我们今天讨论的内容既有战略意义又有社会意义。
另外,人工智能还是正在发展中,不是像人脑那样,因为对脑的理解现在还早着呢。人的大脑复杂程度非常不得了。有人形容人的大脑像一个宇宙,里面的东西太多,现在能理解和知道的东西还是非常少。人工智能的发展空间非常大。人工智能在某些方面的发展,比方说深度学习的带来的进步,大家都知道,深度学习有非常好的应用,而且产生新的效果。但是将来会不会有新的模式发现呢,会不会有新的算法出现呢?刚才有专家讲,我们国家在数据处理方面做得比较好,但是在算法方面还是有差距。我觉得这两个方面都不可偏废。为什么深度学习这样的先进算法在中国没有出现,这是值得我们科技人员深思的问题。我们现在要讲创新驱动发展,讲自主创新的能力,那就要看我们在对人类的知识进步中,我们中国人到底有多少贡献?我们可以很自豪地讲我们古代中国人的贡献很多,但是在近代,只要一看教科书,有几样东西是我们中国人的?这是我们未来科技界未来发展非常重要的目标。
人工智能怎么发展?一方面我们知道了人工智能还有很多很多的问题没有解决,还有很多很多的发展空间,还有很多很多的前沿的事情,今天刘教授谈了很多。但是另一方面人工智能应用会带来非常多的应用,自动驾驶是一个,还有很多的应用出来。想想国家的战略,我们怎么做?科学院怎么做?刚才有两位老师都提到了要我们科技人员加强人工智能在应用领域的工作,我觉得两方面不可偏废:一方面,我们要把很大的力量放在人工智能的应用上去,解决我们很多现在没有解决的问题;同时,至少要有一部分人一定要在前沿工作,进行理论和方法的研究和创新,我们中国人将来一定要给世界知识宝库贡献我们独特的东西,这个不搞研究不行,两方面不可偏废。最近国家在科研基础研究方面也制定了发展规划,我觉得在这个时候提出来非常正确,我们已经在经济上达到世界的第二位,我们做很多方面都变成世界第一了,但是我们在知识创新上,在原创技术创新上还是很少,虽然我们已经有很大进步。基础研究是发展原创技术的源泉,国家在这个时候提出加强基础研究,我觉得是非常适当的。
人工智能现在发展起来了,也是一个社会热点,同时也成为某些商业炒作的卖点,什么都是“智能”的,包括配钥匙的也是智能配钥匙。还有纳米、量子,都成了商业炒作的内容,什么纳米水、量子水,等等,打上这个符号以后就好卖东西了。这说明我们需要对人工智能进行更加广泛和深度的宣传,好好搞科普。张老师提出科普的问题,我赞成人工智能是非常好的科普的题目。还有些科幻故事非常玄妙,像张老师说的可能会误导。我们要用真用科学的东西来引导青年,所以科普工作非常重要。我们老科协的一个重要的任务就是做好科普。所以在这方面,我们希望我们的分院的老同志,特别是计算所的老同志,能够在人工智能科普方面做出我们应有的贡献。
另外,大家还谈到了一些非常重要的事情。比方说加强人工智能研究应用的基础设施建设,就是数据库的问题。我们国家的数据库,实际上已经搞很多年了,科学院搞数据库40年,我们现在的数据库也不少了,但是在有些领域里面数据库还是非常薄弱的。国家科技部有专门的项目支持科技基础设施建设,其中也有科学数据库,包括医疗大数据。但是这些东西都需要很大的努力来发展,而且需要数据保密、数据共享等等这些数据应用的政策和法规。其实现在数据应用有很多问题,就是因为在数据共享、数据保密、数据产权等问题上产生的,隐私的问题也是一大问题。所以怎样发展数据还是一个比较大的事情,但是无论如何数据确确实实是我们将来人工智能发展的一个非常重要的基础设施。
今天的沙龙非常好,大家讨论很热烈,时间好像不是太够,希望下去以后能够继续交流。我赞成除由分院直接组织的沙龙以外,我们分院各研究所可以组织一些小型的专题化的沙龙,解决一些大家特别感兴趣的问题。像今天这样规模的沙龙很难深入进行专业讨论,但是大家可以谈很多想法,可以碰撞新的火花,可以为我们国家为我们院提出想法和建议。今天沙龙题目大了一点,核心问题不是新的应用和研究,而是宏观了解人工智能技术,讨论它应该怎么看待和发展,我觉得今天沙龙的目的达到了。
主持人:今天我们的沙龙讨论会就这里结束,感谢我们省里和院里各位领导和专家,我们今天沙龙开展比较圆满和成功。会议到此结束,谢谢!