最近有一段视频是关于Duplex(谷歌的会说话的人工智能)给一家发廊打电话预约的。人工智能的说话方式惊人地像人类,甚至有时会停下来说“嗯”。

一些人认为,Duplex成功通过了图灵测试(Turing test),这是艾伦·图灵(Alan Turing)在20世纪中期制定的一项机器智能标准。但是这个测试背后的故事到底是什么?为什么人们仍然用它来判断尖端算法的成功?

机械大脑和情感人类

在20世纪40年代末,当第一台数字计算机刚刚被制造出来时,一场关于这些新的“通用机器”是否会思考的辩论开始了。尽管像艾伦·图灵和约翰·冯·诺伊曼这样的计算机科学家先驱认为他们的机器是“机械大脑”,但其他人认为人类思维和计算机计算之间存在本质区别。

当时著名的脑外科医生杰弗里·杰斐逊爵士(Sir Geoffrey Jefferson)认为,虽然计算机可以模拟智能,但它总是缺乏的:

“没有任何一种机制会因为成功而感到快乐,当它的阀门熔合时感到悲伤,因奉承而感到温暖,因错误而感到痛苦,被性所吸引,在得不到想要的东西时感到愤怒或痛苦。”

在几周后的一次电台采访中,图灵回应了杰斐逊的说法,他认为,随着计算机变得越来越智能,像他这样的人会得到“一点安慰,因为他会说,某些人类的特征永远无法被机器模仿。”

第二年,图灵写了一篇名为《计算机器与智能》的论文,他设计了一种简单的方法来测试机器是否会思考。

该测试提出了一种情况,在这种情况下,人类法官通过屏幕与计算机和人类对话。法官看不到电脑或人,但可以通过电脑向他们提问。仅根据答案,人类裁判必须判断哪个是哪个。如果这台计算机能够骗过30%的法官,让他们误以为它是人,那么就可以说这台计算机通过了测试。

图灵声称,他想让这个测试成为对话的障碍,通过假设智力只是一种行为,而不是一种内在品质,来阻止无休止的关于人类本质的形而上学思考。换句话说,智能就是智能所做的事,不管它是由机器还是由人完成的。

谷歌双工通吗?

嗯,是也不是。在谷歌的视频中,很明显,接电话的人认为他们在和人通话。所以它满足这个条件。但图灵最初的测试有一点很重要,那就是要通过测试,计算机必须能够令人信服地谈论所有话题,而不是只谈论一个话题。

事实上,在图灵的论文中,他想象了一场与先进的未来计算机和人类法官的对话,法官提出问题,计算机提供答案:

问:请以福斯桥为主题给我写一首十四行诗。

A:这次别把我算在内。我从来不会写诗。

问:请把34957加到70764。

答:(停顿约30秒,然后给出答案)105621。

问:你下棋吗?

是的。

问:K1有K,没有其他的。只有K6处的K和R1处的R。这是你的行动。你玩什么?

A:(停顿了15秒后)R-R8伙伴。

图灵在这里要说明的是,真正的智能机器必须在人类感兴趣的许多不同领域具有一般智能。就目前情况而言,谷歌的Duplex在预订的有限范围内表现良好,但除非重新编程,否则可能无法做更多的事情。

人类的边界

虽然图灵的本意是让他的测试成为机器智能问题的一个话题,但它却产生了相反的效果,引发了半个世纪的争论,争论的焦点是该测试意味着什么,它是一种衡量智能的好方法,还是它仍应被用作一种标准。

随着时间的推移,大多数专家都同意,图灵测试不是证明机器智能的好方法,因为测试的限制很容易被利用,就像机器人的情况一样尤金Goostman据说他几年前通过了这项测试。

但图灵测试仍然被认为是一个强大的哲学工具,用来重新评估我们所认为的正常和人类之间的界限。在他的时代,图灵用他的测试来证明,像杰斐逊这样的人永远不会愿意接受一台机器是智能的,不是因为它不能智能地行动,而是因为它不“像我们”。

图灵想要测试在他那个时代被认为是“正常”的界限的愿望,可能源于他自己作为同性恋者所受的迫害。尽管他是一名战争英雄,但他还是因为同性恋而受到迫害,并在1952年因与另一名男子发生性关系而被定罪。他受到化学阉割的惩罚,最终结束了自己的生命。

在这最后的几年里,在图灵的脑海里,机器智能和他自己的性行为之间的关系变得紧密相连。2022世界杯南美区预选赛积分他担心困扰他一生的偏执和恐惧会破坏人类和智能计算机之间未来的关系。在他自杀的前一年,他给一位朋友写了这样一封信:

“恐怕下面的三段论将来会被某些人使用。

图灵相信机器会思考

图灵与男人同在

因此,机器不会思考

-你的不幸,

阿兰。”

加入谈话

一个70岁的测试能判断现代人工智能的成功吗?