爱吧机器人网 » 技术 > 人工智能 > 正文

一个让深度学习惨败的通用人工智能领域——语境处理

\
“Context”是指用来解释一段给定文本或语句的来源框架,我们可以翻译为上下文或语境。

维基百科将“context”定义为:

*在符号学、语言学、社会学和人类学中,语境(context)是指围绕一个焦点事件的对象或实体,在这些学科中通常是某种交际事件。语境是“围绕事件的一个框架,为事件的恰当解释提供资源”。*

能处理语境是AGI(Artificial general intelligence,通用人工智能)的一个重要特征,特别是对于会话型角色。从这个意义上说,语境可以粗略地描述为谈话所依据的轨道。例如,当我们正在讨论19世纪英国的住房问题时,我们不希望谈话会随机转移到南极洲的企鹅或核聚变。语境将可能发生的会话项(conversational items)的解空间(solution space)缩小到合理预期或相关的范围。

语境处理是令深度学习技术惨败的一个领域。虽然可以在文本语料库上训练深度学习网络来提取有意义或合乎逻辑的信息,但这种技术利用的是语言结构中的模式,而不是真正的语境处理。

\
真正的语境处理是计算密集型的,是在句子、短语、问题、周围信息等之间构建关系图谱,并使用统计分析技术缩小合适的语境范围。

一句像“I love you”这样的话,如果没有周围的信息就会显得模棱两可。表面上这是一种爱情的声明,但如果是跟对立的人说就可能代表讥讽,如果对朋友说又可能代表一种感激或深厚友谊。要搞清楚语境,必须追踪周围信息并与语句相关联。

AGI需要一个应用程序/引擎来跟踪语音/文本以及其他形式的相关信息,以便解析语境。周围的信息不局限于会话中提供的信息,还包括来自知识库和常识的信息。

让我们以一些随机的double entendres(双关语)为例,来说明语句中的歧义是通过知识来解决的:

1.Panda mating fails: veterinarian takes over.

2.Miners refuse to work after death.

3.New obesity study looks for larger test group.

4.Children make nutritious snacks.

5.Criminals get nine months in violin case.

在上述例子中,我们注意到歧义是通过应用我们称之为常识的知识来解决的。运用常识并不一定意味着我们会得到真相,因为奇怪的事情也会发生。例如,在正常的常识下,人类不吃儿童,所以说“Children make nutritious snacks.”在能让人不误解的同时表达出一种幽默感。但是,如果这是一本名为《食人时代》的出版物中的头条新闻,那很可能就是一个合理的观点

因此,在确定语境时,我们必须了解所有周围的信息,这些信息的地位高于一般预期。

语境也与memory(记忆或内存)有关。在许多情况下,语句里的上下文可以指代以前的对话,并且在某些情况下,可以不显式地引用。例如,类似“the pidgeon is in the bath”的暗号将指代事先约定的含义,而不是当前字面意思。因此,在不知道约定含义的情况下,对该陈述的分析就会导致无价值结果。引擎追踪语境必须足够灵活,以允许包含特设的上下文映射。

另一种场景是,手势、眼神、脱离语境陈述(out-of-context statements)等暗示了一种与先前语境的关系。例如,一场谈话可能关于某个家庭成员健康,几个小时后,可能会出现一个带有微笑的“he’s ok”的陈述。把前后这两种语境联系起来是一个统计学可能性的问题。语境引擎必须能够在较长的时间内连接上下文并保留所收集的信息。

Double entendres是语音/文本中另一类有趣的歧义。然而,在这里,真正的语境必须从呈现的画面中推断出来。例如,“he grasped the long hard cold steel rod firmly”。因此,任何语境引擎都必须能够将单词与画面联系起来,然后再与类似的项连接起来。在潜台词(sub-text)优先于字面意思(presented text)的语音或文本中,double entendres只是其中一类,此外还常见于带有政治色彩的作品,或是处理禁忌的作品。

语境引擎是一个高度复杂的应用程序,很难实时运行。在某些情况下,可以通过额外的进程实现再解释(re-interpretations),并且在交互场景中,其必须作为修正引入AGI的会话语音中。如果AGI呈现为一个单独的实体,比如一个人,这可能意味着要等一会儿。但是,如果AGI呈现为多个实体,例如一群人,那么当数据变得可用并呈现为一个组讨论(group discussion)时,就可能会发生中断。

\
语境引擎依赖于坚实的知识库和关于世界及行为的常识信息。没有这一点,误解将频繁发生,自然语言处理/理解的目标将无法实现,AGI可能也将无法实现。



——End——

爱吧机器人网原创编译,转载需注明。

上一篇:研究人员融合人类与AI的创造力 显著提高了深度学习的表现
下一篇:17世纪的莱布尼茨试图制造“思想机器”却被现实打脸
精选推荐
机器人iCub作为嵌入式AI的标准机器人研究平台的重要性
机器人iCub作为嵌入式AI的标准机器人研究平台的重要性

[2017-12-24]  机器人的研究在过去10年中得益于一个具有嵌入式人工智能(AI)的标准化开源平台——人形机器人iCub。iCub最初在意大利被创建,如今在欧洲、美国、韩国、新加坡和日本的实验室......

2022年全球工业机器人市场将达到790亿美元
2022年全球工业机器人市场将达到790亿美元

[2017-09-04]  预计到 2022年, 全球工业机器人市场将达到790亿美元, 并在预测期内登记11 5% 的复合年增长率。随着发展中国家中小型企业需求的不断增长, 采用自动化技术以确保生产质量......

麻省理工正研究植物机器人 让植物自主控制机器人
麻省理工正研究植物机器人 让植物自主控制机器人

[2018-12-08]  控制论通常指人类用机器人部件增强自己。我们听说过动物机器人或昆虫机器人,但我们很少听说植物机器人对吧?一个机器人其实是对植物有很大益处的,因为一般植物根本无法移动......

谷歌在中国成立一个新的人工智能(AI)研究中心
谷歌在中国成立一个新的人工智能(AI)研究中心

[2017-12-13]  谷歌正在中国建立一个新的人工智能(AI)研究中心,希望进一步扩展到中国,以充分利用中国高度重视的人工智能技术。人工智能是目前地球上最具竞争力的领域之一,亚马逊,微软......

智能机器人困惑的时候知道该问什么问题
智能机器人困惑的时候知道该问什么问题

[2017-03-20]   照片:Nick Dentamaro 布朗大学 上周,我们提到了麻省理工学院的一些研究,即通过链接人的大脑来帮助机器人在他们将要犯错误的时 ...

英伟达用联合学习创建医学影像AI 可共享数据和保护隐私
英伟达用联合学习创建医学影像AI 可共享数据和保护隐私

[2019-10-14]  英伟达(Nvidia)和伦敦国王学院(King’s College London)的人工智能研究人员利用联合学习训练了一种用于脑肿瘤分类的神经网络, ...

[2018-01-26]  纽约时报的报道,德国的研究人员已经开发出一种长约七分之一英寸的机器人,首先看起来不过是一小块橡皮条。然后它开始移动。机器人走路,跳跃,爬行,滚动和游泳。它甚至爬出......

一个让深度学习惨败的通用人工智能领域——语境处理
一个让深度学习惨败的通用人工智能领域——语境处理

[2019-11-04]  Context是指用来解释一段给定文本或语句的来源框架,我们可以翻译为上下文或语境。维基百科将context定义为:*在符号学、语言学、社会学和 ...

本周栏目热点

如何才能知道对方宣传的是伪AI? 只需问5个问题

[2017-03-15]  编者按:随着人工智能在图像识别、围棋、扑克等方面取得了重大突破,现在AI现在已经被炒上天去了。很多新推出的产品和服务都是言必称采用了 ...

AI人工智能:帮你测算恋爱的死亡日期

[2017-10-01]  AI是科技领域中的一个概念,而恋爱,是人类的一种情感。科技本身是没有情感的,因此,我们一般不会将AI与恋爱结合在一起,但是最近,由南加 ...

人工智能革命揭秘上篇(上)

[2016-03-09]   我们即将创造出一种新的生命形式,这个事件不仅是进化取得突破的标志,也有可能威胁到人类这个物种的生 ...

谷歌AI对弈围棋冠军李世石 3月9日看曹大元说棋

[2016-03-04]   3月9日,我们将迎来一场人机世纪大战!战书已升起,100万美元的奖金悬在空中。人工智能和人类大脑,究 ...

Facebook人工智能机器人生成照片以假乱真

[1970-01-01]    无论你是否认为面部识别令人毛骨悚然,很明显全球多家科技公司正在继续投资开发更强大的图像智能技术。  无论是微软的猜年龄机器人, ...