真正的智能化交互,到底离我们有多远? | 王守崑 一刻talks第67
特别声明:《真正的智能化交互,到底离我们有多远? | 王守崑 一刻talks第679位讲者》转载于网络,并不代表傻大方资讯网的立场。
这是一刻讲者王守崑@一刻talks第71演讲局的分享,作为中国最早的个性化推荐系统的研究者和实践者之一,他认为对话事实上是一种粘合剂,可以把各种AI技术粘合在一起,然后把内容真正提供给用户,使用户在这个过程中获得更好的服务。他说,算法应该使我们这样的一个社会化交互的过程更加便利、更加美好,而不是取代它。
感谢一刻能够给我这个机会,跟大家交流关于人机交互。我今天给大家分享的题目是“对话机器人,开启人机交互的大航海时代”。星球大战系列电影里面很著名的两个机器人,一个是 C-3PO ,一个是 R2-D2。它们两个,一个是精通 600 万种沟通方式,熟悉各地的风土人情。另外一个是个技术专家,熟悉太空船上的各种技术设备以及各种跟电脑之间的交互。其实这个也是很多科幻电影,包括一些媒体给我们描述的一个非常美好的、非常有冲击力的一个未来,这个机器人是不是很快就要替代我们人类了?
我们大家回到现实,看我们周边是什么样的。这是一个全球出货量最高的智能音箱排前三位的应用,定闹钟、查天气、听歌或新闻。右边这个是一个智能的语音助手,我想让它帮我查一下国航去上海最早的班机是什么时候,然后它给我找了一家在上海的叫作国行的公司。
我相信这样的事情,只要你在用现在的各种智能产品,现在的各种对话机器人,大家都碰到过。为什么会是这个样子?这个跟我们所预期的那样一个美好的未来,其实有很大的一个差距,以我们现在的技术水平来看。我过去一直在做技术,过去十几年一直在做各种各样跟个性化推荐、跟自然语言处理、交互技术相关的东西。
我们当前的技术水平使得我们做的各种智能产品,各种对话机器人,其实是从根本上没有办法达到交互设计所要求的几个原则,用户的自由度跟控制度的高度统一的原则。我们在面对智能产品的时候,很多人都有过这种很迷失的感觉,就是说我不知道该从哪入手,我不知道它到底该做什么,它过于自由了。当你一旦用起来的时候,你会发现,它能帮到你的地方其实很少。比如说你在做这个所谓智能语音助手的查询的时候,你会发现它的控制有点过紧了,你的心里会有落差,然后你很难形成完整一致的心理预期。然后就是为情景而设计,也是交互设计的一个非常重要的原则。
我们发现现在大部分的智能交互产品,其实都没有遵循这样一个原则,或者说它的情景过于宽泛。
那现在是不是一个投身对话式交互的好时机,作为创业者,其实我一直在问我自己这样的一个问题。
为什么我会说,现在会是一个大航海的这样时代呢?我们大家回想到 500 年前,就是地理发现和大航海时代。那个时候哥伦布发现了新大陆,达·伽马首次在人类航行的历史上绕过了好望角,进入了印度洋,然后在 1519 年到 1522 年这三年之间,麦哲伦首次完成了环球航行。很多学者认为,其实这个是我们当前的近代社会的开端,但是在当时的那个时代,他们的设备、人员、技术极其简陋,而且他们不知道,出去之后会碰到什么样的事情。我觉得那个时间跟我们现在做人工智能、做这个对话式交互所处的情况非常像,我们的手里的工具有限,我们面临的技术挑战非常之大,但是只有在这样的一个条件下,我们才能真正的去发现,去开创我们的未来。
在 60 年前,这个图灵测试提出的时候,其实是计算机领域最早开端的时候,就是我们这个对话这件事情,或者说自然语言处理这件事情,就处于整个人工智能领域的核心。
2016年我们做对话式交互的人,会把它叫对话机器人的元年。为什么呢?其实是背后有两个推动的因素,第一个推动的因素,是我们现在每个人的上线时间,其实大部分是被消息平台所占据了,也就是说,人们是接受这种文本和语音的这种方式的。另一个推动的因素,当然就是计算能力和人工智能算法的发展,在 2016 年的时候,也是这个东西真正进入了我们大众的视野。
正是这两件事情,使得我们这些做人机交互的人,在 2016 年真正能够去做对话式交互的这样的创业的事情。那具体到我们在做的对话式交互,也就是说 CUI,Conversational user interface。跟我们大家熟悉的,我们每个人在手机上,在电脑上经常用的 GUI,就是 Graphical user interface ,就是图形交互,它们俩的本质上的区别是什么呢?
从效率的角度来讲,GUI 图形界面更强调信息广度的展示。而对话式交互更强调信息深度的挖掘,这是一个效率上的不同。
那从用户的感受的角度来讲,图形界面更强调空间感,而对话式交互,更强调时间感。就是用户会对时间的流逝更加敏感。
那从预期的角度来讲,图形界面,它更强调的是公共属性,那么用户对它的预期是,每个人看到的东西基本类似或者说是大致相同。而对话式界面,它天然就是个性化的,我们希望跟每个人的对话是个性化的,我希望我们每个人的对话都是个性化的,我们不期待从它那获得的是大家都一致的东西,如果都是一致的东西,你反而心里会有这样一个别扭的感觉。而且我们对对话的一个预期是有参与感的,它能够自我学习的。所以所有适合做信息深度的展示,所有适合做因果关系以及自我净化、自我学习的事情在交互上,其实都是适合用CUI来做的,用对话的方式来做的。
此外,对话是作为人工智能技术的一个非常好的一个出口,因为对话本身不是目的,对话事实上是一个粘合剂,它可以把我们背后的各种 AI 的技术粘合在一起,然后把这个内容真正提供给用户,使得用户在这个过程中获得更好的服务。
深入的沟通、时间的因果关系、自我学习,其实这些都是我们当前的人工智能技术所关注的,所真正想去实现的。对话未必会全部替代图形界面,甚至我觉得就在未来若干年很大一部分还是通过图形界面来去提供,但所有这些人工智能技术其实是适合使用对话作为这样一个人机交互的接口。
从商业上来讲,我们更强调的是做有清晰的知识结构和边界的事情,包括我们会做一些非标准化的服务。我们通过数据的积累,通过知识的积累来提升服务质量,来提升技术的壁垒。
事实上,在很多行业,对话机器人的这个渗透率已经超过了 90%,当然主要是在客服销售市场以及订单处理等等这样一些技术性的一些环节。
对话的技术在一些特定的行业、特定的领域,事实上已经有相当高的渗透率。这些是我们在做的一些有趣的场景,包括比如说智能投顾,就是为每一位中产的家庭提供一个投资理财的方案,投资者教育等等,用对话来去做信息的发现、解释以及产品的推荐。HTML5 的页面,尤其是在手机上,改成一个对话式的交互之后,我们会发现转化率甚至会提升几倍以上,在很多场景下。
那从现在我们往更远的时间去看,真正的智能化的人机交互离我们现在到底还有多远?
我们先看一下 CUI 的一些挑战。这些挑战的表象其实就是产品缺乏,这些所谓人工智能产品缺乏一个常识和自我学习的这样一个能力,你问它很多常识性的问题,它其实是没有办法回答的。需要做一步两步推理的东西,一步可能有些能做到,但是两步以上的推理现在绝大部分是没有办法做到的,商用的环境下,没有办法做到。另外就是缺乏自学的这样一个能力,其实根本性的问题,是在我们当前的计算框架之下,语言跟知识没有一个好的表示方式。我们人类的语言在计算机的体系下的表示,它就是字符,它不是语义,它跟数字没有任何区别,不管你是中、英文,它就是一个一个的字符。
我们的科学家和工程师们在过去几十年前,花了巨大的精力来去解决这个问题,为语言跟知识找一个合理的好的表示方式,开发了各种各样的工具,用了各种各样的算法,包括现在很流行的 deep learning 的这种算法。但是很遗憾,在这件事情上进展非常有限,在实验室的环境下,特定的领域里有一些进展,但这些东西很难拿到实际的商用的场景里面来,所以这个也是我们目前,不管是技术领域还是商业领域,在人机交互的领域,对话式人机交互领域所面临的最最重大的挑战。
那我们回到 AI 到底能做什么事情,这个原则上,所谓的一秒法则,在一秒钟之内能够完成的事情,就比如说认识别人,你看人脸,然后认识他是什么人,甚至包括自动驾驶,开车这件事情。因为你在开车的时候,你的反应肯定不要一秒的时间,大概在几十、几百毫秒这个量级,如果时间再长的话肯定会出事,所以这些事情都适合AI来去做的。
当前的 AI 就能够去做的事情,那这一秒法则意味着什么呢?
也就是那些大规模的、重复性的、限定领域的,他不需要跨领域的,以及能够快速获得反馈的事情,在当前的这个状态下都是我们能够解决的。那用这个原则以及当前我们在自然语言处理领域的进展来看,我个人认为在以下的这些方面,我们能够在短期内获得一些突破,这是纯粹我个人的观点,一个假想的语义智能的时间表。
初级的文案工作,就是把这个文案提取各种关键词,然后按一定固定的格式找到里面相关的重要的信息,甚至包括一些财报的整理,抽取里面的关键的信息,体育比赛的关键信息,一些其它的财经新闻等等。这部分现在是可被商用的,现在技术上已经解决了。包括对话领域的,就是智能问答,就是大家看到右边的这个部分是文字处理的部分,自然语言处理的部分。
左边这部分是所有的对话式的部分,涉及到人机交互的部分,就是我们期待的那种,你能跟它进行正常的对话。我认为也在三到五年之内,在技术上是可以突破的。
最后我送给大家一句话,这句话也是我这十几年来做算法、做技术,一直秉承的一句话:算法应该使我们这样的一个社会化交互的过程更加便利、更加美好,而不是取代它。谢谢!
一刻talks ? 全球创见者分享平台
长按下方二维码发现更多未知惊喜
- 少林寺英国分部的镇场武僧,这才是真正有功夫能打的武僧!
- 特里:穆里尼奥还没找到真正把他看作主教练的球队
- 外面的房子只是一个住所,老家的房子才是真正的家
- 不给对手留任何时间!回顾乔约翰逊生涯的压哨绝杀
- 据说没吃过这种东西的,不算真正的鳌江人!
- 吃过这10样东西,才算真正的荆州人!
- 能远程控制还能与平台交互 你家的空调够智能吗?
- 什么样的水果干,才是“真正”健康的果干?脆枣、果脯是吗?
- 被誉为全京城最雅致的牛排餐厅,真正的无国界西餐厅第一网红
- 一部真正的合家欢,《捉妖记2》与春节绝配