用中文传话游戏理解RNN-神经网络-技术-爱吧机器人网

用中文传话游戏理解RNN

2018-05-31 AI研习社浏览量：

本文为雷锋字幕组编译的技术博客，原文名 Understanding RNNs using the game of Chinese whispers ，作者 Eniola Alese。翻译 | 陈涛整理 | 吴璇

循环神经网络（RNN）是人工神经网络中非常流行的一个版本，其可以很好地处理序列数据类型。该数据类型指的是将一组数据点以特定顺序排列，从而使相关的数据点一个挨着一个，具体的例子有：股票市场价格、音频和视频数据、DNA 序列、传感器数据、自然语言文本等等。

为了直观地了解 RNN 是如何工作的，假设我们正在玩一个很受欢迎的儿童游戏——中文传话。该游戏的目的是最后一个人能准确预测出句子中所漏掉的词语，比如「The brown dog has four _____」。

中文传话游戏

玩家们需要排成一队，并且根据句子中词语的排列，每个人都会得到其中的一个词语，比如玩家 1 得到词语「the」，玩家 2 得到词语「brown」，玩家 3 得到词语「dog」，以此类推。首先，队伍中的第一个人把他听到的词语悄悄地告诉队伍中站在他身后的玩家。然后这个玩家将这个词语和自己的词语一起悄悄地告诉他身后的人。接下来，整个队伍不断重复这个过程直到最后一个玩家。最后的玩家需要预测出所漏掉的词语，并大声地把这个消息告诉整个集体。

显而易见的是，最后一个玩家可以准确地猜出漏掉的词语是「legs」。这是因为前一个玩家告诉了他这个句子的前面部分：「The brown dog has four」，所以他能够通过该语境推导出这个词语。

上文说明了 RNN 的基本原理。通过提取序列之前的信息，并结合序列当前的输入，该网络能够预测出序列的下一个输出。

RNN的展开由上文可知，RNN 能够通过对整个序列重复同样的过程，从而做出预测。左下图显示了循环网络的基本结构。它同时接收序列数据输入向量（x）和隐藏状态信息（a），然后使用二者去预测序列数据的输出。

为了正确地将系统工作方式可视化，我们通常把 RNN 展开成与序列数据长度一致的一连串重复的单元或称之为时间步（如右上图所示）。比如我们需要处理的序列是一个有三个词语的句子时，那么其将被展开成有三个时间步的 RNN 网络，每一个时间步处理一个词语。

RNN 的设计架构序列数据的输入和输出有各种各样的形式和长度。比如在情感分析任务中，输入通常是一串文本，而期望的输出是一个整数（1-5 的评分范围）或是单个文本（好的、坏的，积极的、消极的、中性的）。然而在语音文本任务中，输入则是声波中的一串声音信号，其输出则是一串对应的文本。

正是由于这些差异，当需要处理序列任务时，我们会针对性地设计 RNN 的输入和输出结构。一些常见的架构类型如下：

1. 多对多架构（同样的序列长度）

这是最基本的 RNN 结构，在每个时间步中输入序列的数量与输出序列的数量是一致的。一个使用该架构的应用实例是文本生成器：根据句子中前面的词语，预测下一个最有可能的词语。

采用多对多 RNN 架构的文本生成器

如上图所示，文本生成器的输入是一串词语，输出则是由预测得到的下一个词所组成的一串词语：「brown dog has four legs」。

2. 多对多架构（不同序列长度）

当需要处理输入和输出序列的数量不一致时，我们便可采用多对多架构的另一种版本。而机器翻译任务就是这样的一个应用实例：输入是原文的一串词语（比如法文），而输出是译文的一串词语（比如英文）。这个架构有两个不同的模块：编码器和解码器。前者接受输入的句子，将其映射成内部状态表征，然后将其传给后者，以供其生成输出的句子。

采用多对多 RNN 架构的机器翻译

在此架构中，当编码器将全部的输入序列处理完后，解码器才开始对输出的序列进行预测。这与前面提到的相同序列长度架构完全不同，在那个架构中，其每收到一个输入序列对象后，马上开始对每一个输出序列对象进行预测。

3. 多对一架构

在此架构中，RNN 在每个时间步都有一串输入，但只有在最后一个时间步输出一个单一值。情感分析任务正是此情景下的应用实例：任务的目的是对输入的语句进行分类，判断其是否有正面或负面的情感。

采用多对一 RNN 架构的情感分析任务

在上图的情感分析任务中，RNN 并不是在每个时间步都有输出，而是在读完整串词语后，仅在最后一个时间步输出一个单一值：「positive」。

4. 一对多架构

此处的 RNN 在第一个时间步接受一个单一值，然后在剩余的时间步中输出一串值。基于此架构的应用通常会取得每个时间步的预测输出，并把它传递给下一层，作为该层的输入值。一个应用实例是图像标注：RNN 接受一幅图像作为输入，然后输出描述图像中所发生事情的一串词语。

采用一对多架构的图像标注

上图显示了输入是一个女性跑步的表情符号，而输出则是预测得到的一串词语：「woman in blue vest running」。

结论

在这篇文章中，我们简单介绍了循环网络以及其不同类型的架构，包括相应的应用实例。

来源
https://medium.com/learn-love-ai/introduction-to-recurrent-neural-networks-rnns-43238d037a5c

精选推荐

亚马逊计划建一个4000万美元的机器人中心

[2019-11-07] 爱吧机器人网消息，亚马逊11月6日宣布了一项计划，计划在美国马萨诸塞州韦斯特伯勒建立一个4000万美元、35万平方英尺的机器人创新中心。新 ...

亚马逊CEO杰夫·贝佐斯操控巨型有人驾驶机器人（巨型机甲）

[2017-03-21] 近日，亚马逊CEO杰夫·贝佐斯实现了每一个6岁儿童都会有的梦想，他控制了一个巨大的机甲机器人。据国外媒体Verge报道，前天（3月19日），贝 ...

通过对抗性图像黑入大脑

[2018-03-02] 在上面的图片中，左边是一张猫的照片。在右边，你能分辨出它是同一只猫的图片，还是一张看起来相似的狗的图片？这两张图片之间的区别在于， ...

集群机器人领域最新研究：一种用于探测未知环境的微型无人机群

[2019-10-26] （图：无人机扩散至不同方向来探索环境。当一个无人机注意到另一个无人机在它的首选方向，它将试图飞到另一个方向。若首选方向冲突，低优先 ...

机器人灵巧手将成为智能机器人的下一个重大突破

[2018-01-25] 计算机科学教授兼东北地区助手机器人实验室负责人罗伯特·普拉特（Robert Platt）说：“机器人手操作是下一步要解决的问题。想象一下，一个机器人可以在现实世界中用手去做事......

国外眼科手术机器人为视网膜静脉阻塞患者带来希望

[2017-03-20] 视网膜静脉阻塞，简称RVO，对患者来说是一种严重的疾病。该病病因为视网膜静脉中存在血液凝块，这可能导致视力严重下降，在某些情况下，病 ...

农业将为高科技行业农业机器人的应用领域

[2017-12-17] 农业正在迅速成为一个令人兴奋的高科技产业，吸引了新专业人士，新公司和新投资者。技术发展迅速，不仅提高了农民的生产能力，而且促进了我们所知道的机器人和自动化技术的发展。...

智能机器人困惑的时候知道该问什么问题

[2017-03-20] 照片：Nick Dentamaro 布朗大学上周，我们提到了麻省理工学院的一些研究，即通过链接人的大脑来帮助机器人在他们将要犯错误的时 ...

本站内容除了特别注明本站原创以外均来自互联网，文章观点不代表本站立场，文章版权归属原作者；如涉及版权问题，请联系[email protected]，我们会立即处理。谢谢配合！

本周栏目热点

用中文传话游戏理解RNN

[2018-05-31] 循环神经网络（RNN）是人工神经网络中非常流行的一个版本，其可以很好地处理序列数据类型。该数据类型指的是将一组数据点以特定顺序排列，从而使相关的数据点一个挨着一个，具......

深度神经网络会产生人这样的智能吗？

[2016-11-20] 深度学习在近年的进展又一次点燃了各界对人工神经网络的热情。这一技术在图像识别、语音识别、棋类游戏等领域的成效出人意料，而且 ...

Hopfield神经网络模型

[2016-11-20] Hopfield网络是神经网络发展历史上的一个重要的里程碑。Hopfield 神经网络是1982年美国物理学家J Hopfield首先提出来的，属于 ...

谷歌神经网络技术已实现数十种语言实时翻译

[2016-11-20] 你可能仍然无法与海豚或外星人交流。然而借助谷歌翻译，现在你可以在全世界大部分地方使用自己的母语与别人沟通。或者至少，你可以 ...

VC环境下调用nnToolKit神经网络工具包实现混合编程

[2016-11-20] 1 nnToolKit简介 nnToolKit 神经网络工具包是基于 MATLAB 神经网络工具箱自行开发的一组神经网络算法函数库，其中的函数在MA ...