首页 百科知识 人工智能的未来:技术登峰造极

人工智能的未来:技术登峰造极

时间:2024-01-23 百科知识 版权反馈
【摘要】:几乎每一款产品都是先由人脑和人工智能合力设计出来,再在工厂自动生产的。汽车已配备了自动注意道路情况,以及提醒司机危险迫近的功能。MobilEye技术能警告司机将会发生的碰撞或者有小孩在车前奔跑等危险状况。如本章所述,我在人工智能领域的工作便是以语言为中心的。评论家提出,完整的人类水平智能测试应当包括掌握视、听信息能力的测试。即使不是人工智能专家,人们也会被沃森在《危险边缘》中的表现所震撼。

人工智能的未来:技术登峰造极

1.一个徒有其表、胸无点墨的演讲者冗长无趣的发言。

2.孩子会穿上的一种衣服,也是歌剧中某艘船的名字。

3.12年来胡鲁斯加国王的士兵不断被杀,官员贝奥武夫被派来解决这一难题。

4.它可能是随着意识的发展而形成,也可以指怀孕

5.国际教师节和肯塔基赛马日(Kentucky Derby Day)。

6.华兹华斯Wordsworth)曾说,它们不会漫步闲逛,一定会直飞云霄。

7.固定在马蹄上的铁制品或赌场里发牌的盒子上印着的4字母单词

8.意大利歌剧作曲家威尔1846年创作作品中的第三场,情人奥黛贝拉受到了上帝的惩罚。

这些是节目《危险边缘》中的提问,沃森全部给出了正确的答案。答案是:甜酥饼式的长篇大论、围裙、格伦德尔、孕育、5月、云雀和鞋子。对于第8题,沃森先回答:阿蒂拉是谁?主持人回他:能更具体吗?沃森便明确答道:匈奴王阿蒂拉是谁?这就是正确答案。

计算机寻求《危险边缘》游戏提问线索的技术与我的颇为相似。计算机会先找到线索中的关键词,然后在自身的记忆中(在沃森的例子中,该记忆是指拥有15兆兆位的人类知识的数据库)寻找与关键词相匹配的话语。计算机会严密排查能从上下文信息中得知的那些排名靠前的搜索结果:类别名称、答案类型、时间、地点,以及提示信息中暗示的性别等。当计算机认为信息量足够确定答案时,便会给出答案。这一过程对《危险边缘》的参与者而言,既迅速又自然,而且我认为在回答问题时,大脑差不多也是如此运作的。

·尼斯,《危险边缘》冠军纪录保持者,后输给沃森

我是欢迎机器人当霸主的人之一。

·詹尼斯,输给沃森后借用《辛普森一家》中的台词

天啊!(沃森)回答《危险边缘》的问题比一般参加者更聪明。这真让人惊讶!

塞巴斯蒂安·特龙,GoogleX实验室创始人、谷歌无人驾驶汽车研究先驱

沃森什么都不懂,他只是一个大型蒸汽压路机

诺姆·乔姆斯基,美国语言学家

人工智能无处不在,发展形势也势不可当。通过短信、电子邮件或者电话与人联系这一简单行为就是用智能算法发送信息的。几乎每一款产品都是先由人脑和人工智能合力设计出来,再在工厂自动生产的。假设明天所有的人工智能系统都罢工了,社会便会瘫痪:我们不能正常从银行取款,存款自然也就化为乌有;通信交通和生产也会全部中断。不过还好,我们的智能机器还没有聪明到能够策划这样的阴谋。

人工智能呈现出一种新特点,即该技术已经彻底改变了普通大众的生活例如谷歌无人驾驶汽车,这项技术可以提供明显减少车祸事故、提高道路流通率、降低开车时操作的复杂性等一系列好处。尽管无人驾驶汽车可能到21世纪末才会在世界范围内广泛使用,但只要这种汽车能遵循某些规定,它就可以在内华达的公共街道上合法行驶。汽车已配备了自动注意道路情况,以及提醒司机危险迫近的功能。该项技术有一部分基于大脑视觉处理模型,该模型由MIT托马·波吉奥教授成功研发。波吉奥的博士后学生阿姆农·沙书亚(Amnon Shashua)进一步开发了这一模型,最终创立了MobilEye公司。MobilEye技术能警告司机将会发生的碰撞或者有小孩在车前奔跑等危险状况。最近,沃尔沃宝马等厂家生产的汽车已经安装了这种技术设备。

有几个原因促使我要在这部分集中讨论一下语言技术。毋庸置疑,语言分层的本质反映出我们思维分层的本质。口语是我们将要讨论的第一个术语,书面语是第二个。如本章所述,我在人工智能领域的工作便是以语言为中心的。掌握语言是靠大量积累而成的一种能力。沃森已经阅读过数亿网页,并且掌握了文档中所包含的知识。最终,机器能够掌握网上的所有知识——也就是人-机文明的全部知识。

鉴于计算机能够以文字信息进行正常的语言交流,艾伦·图灵进行了有名的图灵测试。[158]图灵认为语言包含、体现了所有的人工智能,只借助简单的语言技巧,机器是无法通过图灵测试的。尽管图灵测试是一项涉及书面语的游戏,图灵却坚信计算机通过测试的唯一方法就是真正拥有与人类水平相当的智能。评论家提出,完整的人类水平智能测试应当包括掌握视、听信息能力的测试。[159]因为我的很多人工智能项目包含了教计算机掌握如人类语言、字母形态以及音乐声音之类的感觉信息,因此我也十分支持在真正的智能测试中加入这些信息形式。但同时,我也赞同图灵最初的看法:图灵测试只进行文本信息的测试就足够了,因为在测试中增加视觉或听觉信息并不会增加该测试的难度。

即使不是人工智能专家,人们也会被沃森在《危险边缘》中的表现所震撼。虽然我明白沃森关键子系统中使用的方法,但这根本不会降低我观看他表现的好奇心。即使完全了解系统每一部分的工作原理——实际上无人做到这一点,也不能帮你预测沃森在某种情境下的实际反应。因为它包含了数百个互相影响的子系统,每个子系统又要同时处理数百万个相互矛盾的假设,所以我们不可能预测沃森的实际表现。如果要全面研究沃森的思考过程,一个3秒钟的问题就会让我们花掉数百年的时间。

继续讲我的故事。20世纪80年代末和90年代,我们开始研究某些领域对自然语言的理解。我们提供一种叫作库兹韦尔之声KurzweilVoice)的产品,你可以对着它讲任何你想讲的话,只要与编辑文档相关即可,例如将前一页的第三段移动至此。在这一有限却实用的领域中,库兹韦尔之声表现良好。我们还将这一产品延伸到医疗知识领域,医生可以借助它记录病人的报告。上述产品对放射学和病理学相关领域的知识也有足够的了解,如果报告有不清楚的地方,该产品就会向医生提出疑问,并在报告过程中引导医生。这些医疗报告系统已经发展为Nuance公司价值百万美元的企业项目。

鉴于自然语言理解在自动语音识别中的应用,自然语言理解已成为当下研究的主流。截至本书写作时,苹果手机上的语音助手Siri在移动计算机界引发了巨大影响。你可以吩咐Siri做任何智能电话可以做到的事情,比如附近哪里可以吃到印度食品,或者给妻子发条短信说我正在路上,或者大家对布拉德·皮特的新电影有什么看法。而且,大多数时候Siri都会回答。Siri还会发出少量没有实际意义的闲聊用来娱乐。如果你问它生活的意义何在,它会回答“42”,因为《银河系漫游指南》(TheHitchhiker’s Guide to the Galaxy)的粉丝把它作为生命、宇宙和一切终极问题的答案。新一代搜索引擎WolframAlpha会回答那些知识性问题(包括生活的意义),对此的描述详见后文。聊天机器人chatbots)很多,它们什么事都不做只是闲聊。如果你想跟我们名叫拉蒙娜(Ramona)的聊天机器人聊天,请访问我们的网站KurzweilAI.net,并点击“Chat with Ramona”(与拉蒙娜聊天)。

有人向我抱怨Siri不能满足某些要求,但我发现这些人也总是不断抱怨客服人员的服务。有时,我建议他们跟我一起试用Siri,之后他们觉得Siri的表现超出了预期。这些抱怨让我想起了那只会下国际象棋的狗的故事。它的主人如此回答满腹疑惑的人:是真的,它的确会下棋,只是结局比较惨。”Siri现在也开始遇到强劲的对手,比如谷歌语音搜索。

普罗大众与掌上电脑进行自然对话是时代的标志。人们往往会因为某物存在缺陷就对其予以否定,第一代技术也没有逃脱这种命运。即使多年后,此项技术成熟了,人们还是没有重视它,因为它早已过时。但事实上,Siri作为第一代技术的产物运行优良,而且这款产品会越来越受欢迎。

Siri使用的是Nuance基于马尔可夫层级模型的语音识别技术。自然语言的外延最先是由美国国防部高级研究计划局(DARPA)赞助的CALO项目开发的。[160]Nuance的自然语言技术优化Siri的功能,还提供了一项与Siri非常类似的技术——“游龙Dragon Go)!(www.xing528.com)

理解自然语言使用的方法与理解隐马尔可夫层级模型有很多相似之处,实际上,隐马尔可夫层级模型本身的使用就已经很广泛了。有些系统并没有明确标明使用的是隐马尔可夫模型还是隐马尔可夫层级模型,不过这两种模型工作的数学原理是完全一样的。它们都包含线性序列层级,其中的每个元素都有自己的权重、能够自我调试的联结,以及基于学习数据建构的全套智能系统。通常,在实际运用这些系统的过程中,学习得以延续。这一方法与自然语言的层级结构相适应——从词性到单词,到短语,再到语意结构,只不过是抽象概念的自然延伸。在参数上运行遗传算法也是有意义的,因为这些参数控制这种分层学习系统的精确学习算法,并选择最优化算法细节。

在过去10年中,创造这些层级结构的方法有了新的变化。1984年,道格拉斯·莱纳特(Douglas Lenat)踌躇满志地启动了Cyc项目(代表enCYClopedic),该项目着眼于创造能够整理日常常识知识的规则。这些规则组成了庞大的层级结构,每条规则自身又包含一个线性状态链。比如,一条Cyc规则可能表示狗有一张脸。然后,Cyc便联系与脸型结构相关的一般规则:有两只眼睛、一个鼻子、一张嘴,等等。我们虽然希望创建额外的规则以区别狗的脸与猫的脸,但不需要为狗的脸创建一套规则,再为猫的脸创建另一套。这一系统还包括推导引擎:如果有规则规定猎犬是一种狗,狗是一种动物,动物要吃食物,那么我们问推导引擎猎犬吃不吃东西,它会给出肯定回答:猎犬要吃食物。在未来20多年中,集千人之力,将有十多亿条这类规则被编写、测试。有趣的是,编写Cyc规则的语言,即CycL,几乎与LISP语言完全一样。

与此同时,对立学派认为理解自然语言,或者是创建一般意义上的智能系统最好的办法就是通过自动学习,也就是让系统处理与系统设计目的相符的巨量信息。证明这一观点最有力的例子就是谷歌翻译,它可以在50种语言间互译。尽管谷歌翻译包含了2 500种不同的翻译方向,但大多数语言并不能直接互译,翻译仍然需要以英语为中介语言。因此,谷歌需要的翻译器就减少到98个(外加少量与英语不匹配、可以直接互译的翻译器)。谷歌翻译器并不使用语法规则,而是为每一对语言的普通互译创造大型数据库,其基础是罗塞塔石碑Rossettastone)语言库中两种语言间的翻译文档。对于6联合国官方语言,谷歌使用的是联合国的文件资料,因为这6种语言的资料都会出版;对于不那么常用的语言,谷歌就使用其他资源。

结果往往让人惊讶。DARPA每年都会举行不同语言间最佳自动语言翻译系统竞赛,谷歌翻译经常在某些语言翻译竞赛中胜出,因为它打败了那些以语言学家发现的语言规则为基础的系统。

过去10年有两大观点对理解自然语言产生了重大影响。第一个观点与层级结构有关。尽管谷歌的方法从对应语言间词语的序列开始,但其运行必然受到语言内部层级本质的影响。那些在方法上使用了层级学习(如隐马尔可夫层级模型)的系统明显表现得更好,但这样的系统不是自动建立的。人类一次只能学习一个抽象层级,电脑系统也一样,因此我们要仔细控制学习进程。

第二个观点是手动建立的规则较为适合普通基本知识的核心部分。这种方法翻译的短文常常更精确。比如,在短文翻译方面,DARPA将基于规则的中译英翻译系统排在谷歌翻译前面。对于语言的尾部tail),即数百万个不常用的短语和概念,基于规则的翻译系统的精确度却低得让人难以接受。如果我们以训练数据量为参数绘制自然语言理解精确度的图表,基于规则的系统最初性能很高,但随后精确度就降低到70%。与此相对,基于语料库的翻译系统的准确度高达90%,但需要庞大的数据库作为支撑(见图7-15)。

7-15自然语言识别系统的准确率是训练数据容量

注:自然语言识别系统的准确率是训练数据容量的一个函数。提高该系统准确率的最好方法就是将两者结合:对语言的核心部分,我们用人工编程为基础的系统处理;对语言的其他尾部规则,我们则需通过统计数据训练的方法对其处理。

我们常常需要将基于少量训练材料的中度性能与获得数量更多、更精确的翻译的机会相结合。迅速获得中度性能使得我们能在某一领域嵌入系统,然后自动收集人们使用该系统后留下的数据。这样,人们使用系统时系统也能大量学习,精确度就会有所提高。要反映语言的本性,这种数据学习就得充分分层,而语言本质也反映了人脑的工作机制。

这也是Siri和游龙的运行机制——对最常见的和特定的语言现象使用规则翻译系统,然后学习语言尾部就参照在实际生活中的用法。循环团队在以人工编码为基础改进系统遇到性能瓶颈时,也采用这一方法。人工编码的规则有两个必备功能。首先,它们一开始就能提供足够的精确度,这样,试运行系统就能广泛应用,并在使用过程中自动优化升级。其次,它们能为级别较低的概念层级提供坚实的基础,这样就能让系统自动学习,从而习得更高概念层级的知识。

如上所述,沃森是人工编码规则与层级统计学习做法结合的典型例子。IBM将许多自然语言节目结合起来创造了一个可以玩《危险边缘》游戏的系统。2011214日至16日,沃森与两位名列前茅的参与者竞赛——布兰德·拉特尔在竞猜节目中赢得的奖金无人能及;肯·詹尼斯曾赢得《危险边缘》的冠军,而且这一纪录保持了75天。

20世纪80年代中期,我完成了第一部著作《智能机器时代》。在书中,我曾预测电脑会于1998年成为国际象棋冠军。我还预测到那时我们要么降低对人类智力的看法,提升对机器智能的看法;要么降低国际象棋的地位。如果历史是一位向导,我们会将象棋最小化。这些事在1997年都应验发生了。当IBM的超级国际象棋计算机深蓝战胜了人类国际象棋冠军加里·卡斯帕罗夫时,我们立即面对这样的争辩:电脑会赢也是情理之中的事,因为电脑是有逻辑的机器,而国际象棋又是具有逻辑性的游戏。这样,深蓝的胜利显得既不让人惊讶,也不再那么重要了。许多评论家继续争辩,提出电脑永远不能掌握人类语言的细微差别,包括暗喻、明喻、双关修辞、语意双关和幽默。

这也是沃森的胜利具有里程碑意义的原因:《危险边缘》是一个相当复杂、极具挑战性的语言类游戏节目,其中的提问包括了许多人类语言的奇怪变体。许多人可能不会相信,沃森不仅正确回答了那些千奇百怪、复杂难解的问题,而且它利用的大部分知识都不是人工编码的。沃森之所以成功,是因为它阅读过两亿页自然语言材料,其中包括维基百科的所有网页和其他百科全书,足足有4兆字节。正如本书读者所了解的那样,维基百科不是用LISP或者CycL写成的,而是包含歧义和复杂逻辑的自然语句。在对问题作出回应时,沃森会参考这4兆字节资料,然后回答问题(我发现《危险游戏》寻找答案的过程其实是在寻找问题,但这只是技术性问题——答案其实也是问题)。如果沃森能够在3秒内,在两亿页知识的基础上理解并对问题作出反应,那类似的系统也能在网上读取其他上亿个网页资料。实际上,人们正在为此而努力。

20世纪70年代到90年代,我们在研发字符和语言识别系统以及早期的自然语言理解系统时,专家经理expertmanager)这个方法占据了主导地位。我们研发不同的系统、运用不同的方法,但解决的是同一个问题。系统之间的差别有时很小,譬如只是控制学习算法的参数不同而已;但有些差别确实很大,例如用以规则为基础的系统代替以分层统计学习为基础的系统。专家经理本身也是一个软件,通过实时测试性能,总结出这些不同程序处理问题的优缺点。它认为这些系统的优点呈现正交分布:即一个系统在这方面是强者,在其他方面就是弱者。实际上,在调整后的专家经理的管理下,这些系统整体的表现远远好于单个系统的表现。

沃森的工作方式也是如此。借助非结构化信息管理框架(UnstructuredInformation Management Architecture, UIMA),沃森设计了几百个不同的系统。沃森系统中很多的个体语言组成与大众使用的自然语言理解系统是一样的,这些系统要么直接对《危险边缘》的提问给予回答,要么至少简化某些提问。UIMA就像一个专家经理,需要智能整合不同系统的运算结果。但它远远超越了那些早期系统,如Nuance的前身研发出的系统,因为就算它的个体系统没有提供最终答案,这些系统还是能为最终结果献出自己的一份力量——只要能缩小解决方案的范围就足够了。UIMA能计算出得出最终答案的概率。人脑也能这样——在问到母亲的姓氏时,我们对自己的答案会很自信,但是要说出很多年前偶然遇到的那个人的姓氏时,我们就没那么自信了。

因此,为了找到一个能够理解《危险边缘》中固有的语言问题的优雅方法,IBM的科学家将他们能得到的所有艺术语言理解状态模型结合在一起。有些人利用隐马尔可夫层级模型,有些人则采用该模型的数学变体;另外一些人则运用规则方法直接编码一套可靠规则。UIMA根据每个系统在实际使用过程中的表现,以最优的方式对不同系统进行整合。但是公众对沃森系统有一些误解,认为IBM创造沃森系统的专家们太过关注UIMA,即他们所创造的专家经理。有些评论家认为沃森系统并没有真正理解语言,因为很难知道理解位于哪个部分。尽管UIMA也会借鉴自己以前的经验,但沃森对语言的理解并不仅仅位于UIMA,而是分散在很多组成部分中,包括使用与隐马尔可夫层级模型同样方法的智能语言模块。

在决定应在《危险边缘》游戏中下多大的赌注时,沃森技术的某个特定部分会使用UIMA的信心指数评定系统。虽然沃森已特意为这种游戏升级了系统,但核心语言-知识-搜索技术却能执行更多的任务。有人肯定会认为掌握不常用的专业知识,如医学知识,要比掌握那些玩《危险边缘》游戏所需的大众化知识更难。然而事实却恰恰相反:专业知识的脉络更加清晰、结构更加完整,而且相对来说,信息歧义程度较低,所以沃森可以非常容易地理解这些精准的自然语言。IBM公司目前也正与Nuance公司联手打造面向医学用途的沃森系统。

沃森在玩《危险边缘》这个游戏时的系统对话非常简单:出现一个问题,沃森寻找相应的答案,从技术上来讲,就是提出问题并给出答案。在一个对话中,沃森并不需要回顾所有对话者之前的谈话内容(Siri系统则需要回顾部分内容:如果你要求它给你的妻子发条短信,第一次,它需要你指认你的妻子,但以后就不需要你重复指认了)。虽然回顾对话中的所有消息——这显然是一个需要通过图灵测试的任务,是一个额外却很重要的任务,但是任务难度并不比沃森的提问回答任务高。毕竟,沃森已经阅读了数百万页的读物,其中自然包含了很多故事,所以它能够追踪复杂的序列事件。沃森也应该可以追溯自己以往的对话,并在下次回答问题时将其列入知识库。《危险边缘》的另外一个缺点是问题的答案都比较简单,例如,它不会要求竞猜者归纳《双城记》的5个主题。针对这个问题,沃森会找到讨论小说主题的相关文件,并整理出自己的答案。通过自己读书找到答案,而不是抄袭其他思考者的观点(即使没有书面文字),这又是另外一个问题。如果要让沃森自己读小说找到答案,目前来说,对沃森而言显然是一个更高水平的任务,而前者就是我所谓的图灵水平测试任务(需要指出的是,大部分人对此也没有自己的原创观点,而是吸收借鉴了同辈或者专业人士的观点)。现在不是2029年,所以我不会期待沃森可以回答图灵测试中有难度的问题。而且我还要指出:概括小说主题这种级别的问题并不是简单的任务。对于谁签署了《独立宣言》这样的问题,我们可以对其给出的答案作出正确或者错误的判断。但是对概括小说主题这样高难度的问题,我们无法轻易判断其答案的正确性。

值得注意的是,虽然沃森的语言能力低于受教育者的语言能力,但是它却可以成功打败在《危险边缘》中表现最好的两个选手。成功的秘诀在于:借助其拥有的完美回忆功能和准确记忆能力,沃森可以将它的语言技能和知识理解能力完美结合。这就是我们要将个人的、社会的或者历史的信息存储在沃森系统内的原因。

我并不打算更正我的推测——2029年计算机能够通过图灵测试,但是从目前诸如沃森系统取得的进步来看,图灵等级的人工智能应该能够实现。如果有人可以研制出为图灵测试优化的沃森系统,那便离我们目标的实现又近了一步。

美国哲学家约翰·塞尔(JohnSearle)最近提出了一个论点:沃森不具备思考能力。他援引了自己名为中文房间Chinese room)的思想实验(将在第11章详细阐述),说明沃森只是能够熟练地运用那些符号,却不能真正理解那些符号背后的意思。实际上,塞尔并未正确地描述沃森这个系统,因为沃森对语言的理解不是基于对符号的理解,而是基于分层数据过程。假如我们认为沃森系统的智能过程只是熟练地运用符号的话,塞尔的评价就是正确的。但如果真的是这样的话,人脑也就不能思考了。

在我看来,那些批评沃森只会对语言进行数据分析,而不能像人类那样真正理解语言的批评家是非常可笑和滑稽的。人脑在处理各种各样的假设时,也是基于数据信息(新皮质层级结构的每一层都是如此),并通过分层数据分析的方法处理信息的。沃森和人脑都是借助分层理解来学习和作出反应。在很多方面,沃森的知识要比单个人的知识丰富得多,没有哪个人敢说自己掌握了维基百科上的所有知识,而这些知识只是沃森知识库的一部分。与此相反,每个人掌握的概念层级要比沃森多,但是这种差距是可以跨越的。

WolframAlpha是衡量处理组织化信息计算能力的重要系统,这个知识引擎(与搜索引擎相对)是由英国数学家、计算机科学家史蒂芬·沃尔弗拉姆博士(Stephen Wolfram)与他的沃尔弗拉姆研究中心(Wolfram Research)的同事一起开发的。例如,如果你问WolframAlpha(在WolframAlpha.com这个网站上)“01 000 000范围内有多少个质数,它会回答:“78 498”。它并不是从系统中搜寻答案,而是自行算出答案,并在答案的下方列出计算所用的公式。如果你在一般的搜索引擎页面上输入同样的问题,它只会给出你所需算法的链接,并不会直接给出答案。之后你还需要将那些公式输入Mathematica这样的软件中进行运算,虽然后者也是沃尔弗拉姆博士开发的,但是与直接询问WolframAlpha相比,后者要做的工作(需要理解的东西)明显要多得多。

实际上,WolframAlpha包含了1 500万条Mathematica语句。它从将近10万亿字节的数据中计算出答案,沃尔弗拉姆研究中心的员工们仔细整理过这些数据。你可以向WolframAlpha询问很多实际的问题,例如:哪个国家的人均GDP值最高?它会回答:摩纳哥,人均212 000美元。再如:史蒂芬·沃尔弗拉姆多大了?它会回答:在我写下答案的当天,529个月零两天。”WolframAlpha也是苹果Siri系统的一部分,如果你向Siri提一个实际的问题,它就会启动WolframAlpha来处理你的问题。WolframAlpha也负责处理微软公司必应搜索引擎接收的一些提问。

沃尔弗拉姆博士在自己最近的一篇博文中写道:“WolframAlpha现在处理问题的准确率可以达到90%……以大约18个月为半衰期,其错误率也大大降低了。[161]WolframAlpha是一个令人印象深刻的系统,它不仅采用人工编程的方法,还采用了人工搜索数据的方法。这就解释了我们发明计算机的原因。随着科学、数学方法的发现和汇编,计算机在处理此类问题时要远远强于单纯的人类智力。WolframAlpha系统已经收纳了大部分科学方法,而且还在不断更新着从经济学到物理学各种各样知识的最新发展状况。在我和沃尔弗拉姆的一次个人谈话中,他估计如果沃森使用的那些自组织方法正常工作时正确率大约为80%,而WolframAlpha则可以达到90%。当然,这些数字都具有一定的自我选择倾向,因为使用者(例如我自己)已经知道WolframAlpha系统擅长哪类问题,所以同样的因素也会影响自组织系统的评价。沃森在《危险边缘》这个游戏中回答问题的准确率可能是80%,但即使只有80%,也足以打败该游戏最强的人类竞争者。

就像我在思维的模式识别理论中提到的那样,这些自组织的方法需要理解我们在实际生活中遇到的那些非常复杂但又很模糊的层级信息,人类的语言当然也包含在内。智能系统的完美结合则需要在准确的科学知识和数据的前提之下,运用思维的模式识别理论(据我看来,思维模式识别是人脑的工作机制)对不同层级的智能进行综合。这样我们就可以用计算机阐释人类,智能在日后也能继续发展。对生物智能而言,虽然我们的大脑新皮质具有很强的可塑性,但是新皮质自身的物理特性限制了其潜力的发展。将更多的新皮质植入我们的前额无疑是一个非常重要的进化创新,但是目前我们还不能轻易增加额叶的容量,即使只增加10%也很困难,更别说扩大1000倍了。从生物意义上说,我们不能完成这项创新,但是从技术层面来讲,这项创新是可行的。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈