预训练依旧强大：少样本条件下的任务导向型对话生成-机器学习-技术-爱吧机器人网

预训练依旧强大：少样本条件下的任务导向型对话生成

2020-03-07 PaperWeekly 浏览量：

在任务导向型对话中，由于具体领域数据的缺乏，其生成质量长期以来都不够好。

本文首次在少样本（few-shot）场景下的任务导向型对话上，使用预训练提高所生成回复的流畅度与准确度，在自动测评和人工测评上大幅超越之前的模型。

任务导向型对话

现实生活中的对话有相当一部分都是“任务导向”的，即对话都指向一个明确的目的。

这个过程可以用下图来表示：

首先，系统理解用户的意图，然后得到“槽-值”(slot-value)对，比如上面的“出发地：洛杉矶”和“到达地：北京”，最后根据意图和槽-值对生成回复。

然而，目前的任务导向型对话要么依赖于固定的模板，要么只能在有限标注数据上训练，都不能得到很好的效果。

那么，能不能用当前流行的预训练方法去提高生成回复的质量呢？当然可以！因为无标注语料本身就内含丰富的语义，在它们之上预训练自然就可以提高生成的质量。

但是，和其他的预训练有所不同的是，任务导向型的对话往往特别依赖具体的领域，领域之间的差别会导致生成回复之间也会存在巨大的差异。

在无标注和有标注的语料上训练后，最后，只需要在特定领域的少样本数据集上微调，就可以把模型运用到该领域的任务型对话中了。整个过程非常简单，但能够在流畅度和准确度上都大幅超越之前的模型，具有相当的可用性。

值得一提的是，本文的作者还搭建了一个简易的Demo，如下图所示：

用户输入意图（及一些可选的槽-值对），系统就可以自动生成各种可能的回复。可以看到，生成的文本非常流畅，并且也贴近我们输入的意图，可见其实际效果是相当不错的。

预训练＋预训练＋微调＝更好的回复

本文提出的方法可以归纳为三个步骤：预训练，预训练和微调。

预训练 1 ：首先在大规模的无标注文本上预训练。这一步和GPT-2一致。
预训练 2 ：为了让生成的文本更贴近任务导向型对话的要求，模型还进一步在标注的数据集上预训练。这里的数据来自Schema-Guided Dialogcorpus, MultiWOZ corpus, Frame corpus和Facebook Multilingual Dialog Corpus，这些都是人工标注好的人物对话型数据集，来自各个领域，共计约400K个样本。
微调：最后，只需要在特定领域的少样本数据集下微调即可。

模型示意图如下。简单来说，就是给定意图和一些槽-值对，模型据此输出回复。

实验

我们的目标是要提高少样本、特定领域下的生成回复质量，为此，我们在本文创建的一个少样本基准数据集FEWSHOTWOZ上实验。

该数据集包含7个领域的数据，每个领域只有50条用于训练，其他的都用作测试。

下表是本文模型（SC-GPT）和两个基线模型（SC-LSTM、GPT-2）的实验结果：

可以看到，在所有7个领域，SC-GPT生成的文本既更流畅（BLEU更大），而且也更准确（ERR更小），超越幅度也非常大。

那么人类测评又如何呢？下表是人工测评三个模型的表现。

可以看到，就信息度（Informativeness）和自然度（Naturalness）而言，SC-GPT都比两个基线模型更好，虽然和人类表现相比仍有差距，但注意到这是在少样本下的设置，在大样本的情况下，二者几乎不存在差距。

下面是三个领域的例子，和reference相比，SC-GPT已经非常接近了，而其他模型或多或少都具有一些问题。

比如，绿色代表多余内容，红色代表错误内容，紫色代表丢失的内容。

小结

本文提出了一种简单有效的“预训练-预训练-微调”模型，用于提高任务导向型对话的生成流畅度与准确度。

首先在无标注文本上预训练，然后在标注数据上预训练，最后在特定领域的数据上微调，极大地提高所生成回复的质量。

此外，本文还构建了一个少样本基准数据集FEWSHOTWOZ，用于评估少样本下任务导向型对话模型的效果。

最后，本文作者也发布了一个可用的在线Demo，用于展现模型效果，读者可以前往项目地址（https://aka.ms/scgpt）自行探索。

论文标题：

Few-shot Natural Language Generation for Task-Oriented Dialog

论文作者：

Baolin Peng, Chenguang Zhu, Chunyuan Li, Xiujun Li, Jinchao Li, Michael Zeng, Jianfeng Gao

论文链接：

https://arxiv.org/abs/2002.12328

项目链接：

https://aka.ms/scgpt

精选推荐

瑞士研发出微型机器人集群可像蚂蚁一样互相交流并协同工作

[2019-07-12] EPFL（瑞士联邦理工学院）的研究人员受到了蚂蚁的启发，开发了一款仅有10克重的小型机器人：他们可以相互交流，分配角色并完成复杂的任务。 ...

为未来战场创造更有效的机器人美国陆军研究人工纳米马达

[2019-10-11] 为了使机器人在战斗中更有效、更多才多艺地成为士兵的战友，美国陆军研究人员正在执行一项任务，即研究肌肉分子生命功能的价值，以及复制过 ...

如何让人工智能机器人快速自我纠正错误并吃一堑长一智？

[2017-08-23] 莱斯特大学数学系的研究人员在《Neural Networks》杂志上发表了一篇文章，概述了新算法的数学基础，可以使人工智能收集错误报告并立即纠正，而不影响现有技能，同时还会积......

助力卷积神经网络时空特征学习史上最大行人重识别视频数据集被提出

[2017-12-25] 本文提出了一个大型的、长序列的、用于行人重识别的视频数据集，简称LVreID。与现有的同类数据集相比，该数据集具有以下特点：1）长序列：平均每段视频序列长为200帧，包含丰......

德国研发出一种能在你体内工作的微型机器人

[2018-01-26] 纽约时报的报道，德国的研究人员已经开发出一种长约七分之一英寸的机器人，首先看起来不过是一小块橡皮条。然后它开始移动。机器人走路，跳跃，爬行，滚动和游泳。它甚至爬出......

MIT用深度学习处理3D点云数据应用于无人汽车等领域

[2019-10-23] 如果你见过自动驾驶汽车，也许会对车顶上那个一直在旋转的圆柱体感到好奇。这是一个雷达传感器，无人驾驶汽车依靠它在现实世界中进行导航。 ...

麻省理工正研究植物机器人让植物自主控制机器人

[2018-12-08] 控制论通常指人类用机器人部件增强自己。我们听说过动物机器人或昆虫机器人，但我们很少听说植物机器人对吧？一个机器人其实是对植物有很大益处的，因为一般植物根本无法移动......

MIT最新“人机”互连系统让双腿机器人复制人体技能

[2019-11-01] MIT的小爱马仕想借用你的大脑，图片来自: João Ramos爱吧机器人网消息，麻省理工学院（MIT）的研究人员展示了一种新型遥操作系 ...

本站内容除了特别注明本站原创以外均来自互联网，文章观点不代表本站立场，文章版权归属原作者；如涉及版权问题，请联系[email protected]，我们会立即处理。谢谢配合！

本周栏目热点

顶级AI会议NIPS压轴2017（附PPT、视频、代码大汇总）

[2017-12-19] NIPS，全称神经信息处理系统大会(Conference and Workshop on Neural Information Processing Systems)，是一个关于机器学习和计算神经科学的国际会议。该会议固定在每年的12月举行...

机器学习选择深层模型的原因

[1970-01-01] 深度学习采用的模型为深层神经网络（Deep Neural Networks，DNN）模型，即包含多个隐藏层（Hidden Layer，也称隐含层）的神经网络（Ne ...

机器学习—自由编码器

[1970-01-01] 一种常见的深层模型是由自编码器（Auto-Encoder）构造的。自编码器可以利用一组无标签的训练数据{x(1), x(2), &hellip }（其中x(i)是一个n ...

【NIPS最佳论文出炉】冷扑大师能战胜AlphaZero吗？No（Science论文）

[2017-12-19] 拿下NIPS2017 最佳论文，登上Science，“冷扑大师”最近有点热。18日，两位作者，CMU博士生Noam Brown和Tuomas Sandholm教授在Reddit上回答问题。对“为什么不使用深度学习......

日本开发团队给机器人嵌入神经网络

[2016-08-18] 　　近日在日本国立科学博物馆展出的机器人 Alter，可谓是目前世界上最为先进的机器人之一，因为它是一款嵌入了神经网络的机器人，来自日本 ...