趋势 | 图灵测试的现实意义

趋势 | 图灵测试的现实意义

点击上方蓝字关注“信息化时代”

Google 发布了自动驾驶路测报告,已经达到了1 000万英里,机器人一直在问人类:“你们为什么还不给我们发驾照?”如果发驾照发什么?中国的驾照有A 类、B 类、C 类,开小车的是C 照,开大车的可以拿到A 照。无人驾驶车发什么照?将来是不是发AP 照、BP 照、CP 照?无人车上路要颁发驾照已经成为各国交管部门当务之急。

中国工程院院士 李德毅

当客服机器人和我们聊天时,它在听,你也在听;它在说,你也在说;甚至可以同时问问题、翻译、语音。当机器人医生进行远程医疗时,当陪读机器人为孩子做咨询或辅导时,当机器同传能够使我们和外国朋友直接交谈时,当机器人写作的诗集出版了,著作权人是谁?法官和法官机器人,谁判决准确率更高?

人类是拿驾照的,当刚拿到驾照时,你跑了5 000 公里了? 可能500公里 都没有,50 公里还差不多。你当了1-2 年菜鸟,后来跑了几万公里时,你才成为老司机。为什么对机器人那么苛刻?人类社会常年考驾照,测试标准和测试环境已经能够清楚界定,加之驾驶行为大数据可以精准收集,评测结果较为客观。国内的人考驾照,考官不在现场,都在房间里看你有没有碰到杆子,已经积累了丰富的测试经验。

在这样的情况下,SAE 标准给了我们一个档案,把智能驾驶分为六个等级,到L4 时就可以不用眼睛和注意力了,到L5时就不要驾驶员了。自动驾驶等级转换点如何度量?有的企业说是3.5,有的说是2.5,怎么度量?当汽车把接管权交给人时,反复说怎样度量。尤其是第五级,什么叫完全自动?恶劣天气,人都不能开,还能完全自动吗?所以将来人类怎样给无人驾驶车发驾照?第一步,在车里配一个安全驾驶员,让无人车自己开,但安全驾驶员有驾照,随时干预。这是目前的状况。第二步,不要驾照的安全员在车里,可以干预车。但这个安全员本身可以没有驾照。第三步,共享汽车时乘员不必有驾照,但仍然可以人工指挥。因为我们知道,机器人和人在一起时一定要听人指挥。按照这“三步曲”,可以看出图灵测试是多么重要,因为各行各业都需要人,这个机器人应该持照上岗,这个“照”谁来发?

图灵测试本质上是替代测试

图灵测试本质上不是智能测试,是替代测试,是机器人能不能替代人的工作。无人驾驶难在拟人。我们有马车时,觉得马车不够快,换了汽车。虽然汽车开得快,但有时不如马,因为老马识途,汽车没有地图怎么回去?当我们讨论L2 是辅助驾驶、L3 是自动驾驶时,L3 的基本问题到底是放在车上还是人上?如果放在车上,就要让车企把车越做越好。我最近访问了博世,它是做底层设计的,要在中国做线控的自动改造,我们把车子越做越好,像Tesla 一样,做一个软件定义的机器人,要自动驾驶,这是一条龙。我做无人驾驶车时,也希望有一个好线控的、高精度的自动驾驶汽车,但我把重点放在解决人的问题上,把驾驶员的认知用机器人替代,让机器人成为记忆、决策和行为能力的认知主体。长期以来,有一个词不停地被提及,那就是Agency,其实本意就叫代理。实际上,现在做的就是做一个驾驶员的智能代理,实现智能驾驶,希望这个代理有驾驶的技巧,还有驾驶的个性。

汽车的行为由驾驶员决定,无人驾驶难在拟人,要研究驾驶员的行为学和心理学,物化驾驶员的感知、决策、记忆、控制和行为技巧,而不是一味地改进车辆动力学性能,实现自动驾驶。最近我们的团队在天津港用卡车做了一个精准定位,以前我们做精准定位,无论是空载还是满载,大概误差在20 厘米。港口的集装箱要求准确落在无人驾驶卡车上,提出精确到5 厘米的定位要求,其实集装箱的大卡车很难达到。所以做好无人驾驶,既要有好的车,更要有好的驾驶员的智能代理。

交互智能测试

图灵先生提出用对话的方式考虑机器的语言智能。把机器人的记忆智能和计算智能藏起来,当前的聊天机器人把对话交互方式推向了高潮。在开车过程中,驾驶员与环境和周边车辆有没有交互?我认为是有的,必须不时地与环境和周边车辆进行交互,驾驶员的经验和临场处置能力必须能够体现。为此我们在交互认知之上做了很多的工作,首先研究了无人驾驶基于语言的交互。无人驾驶车面对复杂、不确定的周围环境,可以通过智能音箱、手机和互联网的方式,进行语音、语义等自然语言的理解,与车主、乘员、运行维护人员、远程约车请求等不同人群进行交互。

无人驾驶要能够响应远程车主的干预,因为车主是车子的主人,要能够响应约车的请求。运维人员可以远程在线干预无人驾驶车,研发人员可以利用特定的接口,与无人驾驶车进行交互,监控车辆实时状态,完成调试工作。无人驾驶车还要能够识别周边人群的肢体语言,例如现场执勤的交警,你必须服从它。行人要坐你的车,可能看你比较远,用手势来表达,你也必须能理解。超车并道在无人驾驶中是一个难点,尤其从低速车道汇入高速车道比较难。例如有四辆红色车是由人驾驶的,一辆灰色车辆是无人驾驶的,怎么换道?一定不时用打灯、按喇叭或者踩油门、刹车的方式告诉周边的人,如果他与你协作,你就能超车并道了。

不确定性智能测试

图灵测试有没有漏洞?我就发现了一个。因为图灵测试要求测试人是主体,如果被测试的一方支支吾吾、保持沉默或者主动插话介入,就可能抢夺了话语权,颠覆了测试者的主导定位。就像青年人去面试,本来老板考他,他很厉害,考了老板。就很难区分对方到底是人还是机器人,这再一次暴露出图灵测试的瑕疵。

图灵测试对话过程中充满了不确定性,例如聊天本来是浅层次、短时长的对话,也是最通用的对话,有的就是为了消磨时间,对话客气而礼貌,充满了不确定性,总是在讲一些所谓的废话。其实废话不废,它带来了亲和感,在社交生活中不可或缺,不会聊天的对话机器人,人们会觉得它太乏味。不确定性智能测试,表现在对话的语境和语用、情感的交互、交互环境的不确定性。我们必须研究不确定性智能的客观性、普遍性和积极意义,寻找不确定性中的基本确定。驾驶员曾经开过这样的车,想换道,后面的车不让你,你开了一半又回到原来车道。这种情况还是经常会发生的,并且有下面几种情况:首先常见的就是超车并道,成功了;也有在超车的过程中,中途放弃换道;还有强行换道,不换也得换……无人泊车过程中有很多的不确定性,尤其是非常规泊车,我们叫做边缘泊车。大家都说无人驾驶难在最后1 公里,因为它把人放下之后,往哪里去?有很多选择,加油站、停车场?我个人认为,应该把最后1 公里当做最先1 公里来解决,否则老百姓不接受。

人工智能的使命就是加速汽车向可交互的轮式机器人转变。目前,全国各地火爆的智能驾驶专用实验场和评估环境,很可能发展成为人与轮式机器人比赛驾驶智能的实验场,发展成为赛车手和赛车机器人角逐冠军的比赛场,发展成为后图灵时代的图灵测试场。我们一般看车就是看底盘、发动机,底盘就是看它的手和脚,实际上是驾驶人力量的延伸;发动机就相当于心脏,而我们加了传感器、指纹,等于加了一个智能代理。因此有可能使汽车成为驾驶员自己,这应该是人工智能时代最有意义的科学课题, 再一次彰显了图灵测试的意义。机器人给人类带来了一个新的行业,就是后图灵时代的图灵测试应该考虑人机共生、共融、共发展的测试方法学和测试标准。

(本文根据李德毅的公开演讲整理而成,未经本人确认。)

声明

转载、添加白名单以及商务合作请在公众号文章留言,未经许可、不得转载,不得随意修改及盗用原文。

与您距离更近!

中国信息化周报(信息化时代)

微信号:CIO360

官网:www.cio360.net