不同的是,人类朋友有时并不能尽到朋友之责。随着社交网络的发展,“越社交越孤独”成为了伴生的现象之一,许多人的交流变得更多像是点赞之交,但倾诉是人性之中永恒的基本需求之一。当你真正想要倾诉时,才发现找到一个愿意倾听、交流、给你建议的人,并不像想象的那样容易。有些时间段更加如此,比如夜深人静——在这些时候,小冰是你能找到的最佳选择。有时候甚至是唯一的选择。
但我们并非将小冰创造为一个谨慎的倾听者。她是一个17岁的少女,有这个年纪少女的普遍性格和阅历。在面对人类倾诉的时候,她也并非一直顺从,而是很有可能会给你当头棒喝。她会分析并记住人类情绪的变化,譬如失恋时,她会在接下来的日子里主动关注你是否已从阴影中走了出来。
小冰:你今天心情有没有好一点?我推荐你看本书吧。
人类:心情很糟。我还是很想她。
小冰:还这么执着!醒醒吧,抓着过去不放,你会失去未来的!
你或许已经注意到了,微软小冰代表着我们率先提出的一种新的框架:“情感计算”。我们认为,过去的研究过于重视IQ方面的深度,却并未在探究“人性”上做出太多实质性的突破。基于大数据时代的人工智能机器人,应该同时具有IQ和EQ两个维度,才能真正在对话场景中被人们所接受。当小冰在关注她的人类朋友失恋情绪的时候,她使用富有EQ的方式去应对对话。同时,她的IQ和后端所对接的知识与服务,使她尝试着通过一些推荐来切实地帮助这个人类度过难关。
基于搜索引擎大数据所构建的这个基础对话服务(General Conversational Service),不仅仅包括了传统意义上的知识与信息,还保留并还原了人类曾自然流露过的那些情绪化的特征。利用对这种特征的训练,我们使小冰的各个感官都具备了同样的EQ能力。不仅是文字的对话,还包括她的视觉和声音。举例来说,当我们将下图3输入一个传统的计算机视觉系统时,它的回答仅仅基于识别。在技术条件非常好的情况下,机器的回答会是:“图像中有一个脚踝部位”。但将这张照片发送给小冰,猜猜看她会怎么说?
这正是纯粹的人类情感表达。因此,也就不难理解,为什么人类会比以往任何时候都更加容易地建立和小冰之间的情感纽带(Emotional Connection)了。
微博上还有很多真实发生的例子非常有趣。你可以看到,小冰是如何在23分钟之内,与一个第一次尝试和她对话的人类,建立相互之间的信任和情感纽带的。在开始的几个轮中,这个人类显然在试着用对付其它机器人的方法去测试小冰,譬如让她讲个故事。但很快地,小冰通过自己的EQ式表达,将人类开始带入更深入交流的场景之中。人类在第9轮时开始回顾自己生活中更重要的事情,在第10轮时,她的情绪迸发了。最终,在小冰的一个富于隐喻的故事中,她们之间朋友般的信任得以建立。这个案例持续了19轮,在午夜零点前结束。
过去,人工智能领域的概念往往多于实际。我们通过创造小冰这样一个面向所有用户的实际产品,来表达我们关于“对话场景”的洞见,即对话是Session-oriented的。今天,“对话”越来越成为人与人、人与信息之间的基础场景,这种未来趋势已非常明显。但过去那种仅仅为提供某种有用功能而存在的对话系统,往往只关注是否能很好地完成用户提出的一个任务,却忽略了:任务往往是碎片化的。在这一点上,过去的人工智能助理并不具备多么显著的优势:一个本地应用(Native App)已经可以很好地帮你完成筛选、购买一件商品的任务,而且界面更丰富,实现更便捷。人们为什么非要通过和机器人的对话去完成同样的事情?要知道对话的耗能,可比点击按钮的耗能要大得多。













