爱吧机器人网 » 资讯 > 企业 > 正文

云知声数据标注团队:我们是怎样教机器人说话的

"如果机器在某些现实的条件下,能够非常好地模仿人回答问题,让提问者在相当长时间里误认它不是机器,那么机器就可以被认为是能够思维的。" —— 阿兰·图灵

人机对话是人类对人工智能最初的设想,也一直是人工智能领域的目标之一。

即使我们经常听到"这个问题我还没有学会",但是不可否认,人工智能已经基本实现"可以说话"了。那么,机器人是怎样学习的呢?这就需要提到人工智能需求下诞生的一个新职业,也是人工智能背后的"隐形者"——数据标注专员。

云知声数据标注团队:我们是怎样教机器人说话的
众所周知,我们教小孩子认识海豚,就要拿海豚的图片告诉他,这是海豚。久而久之,他记住了海豚的特征,当他去动物园看到了海豚,就知道那是海豚。类比机器人,为了让机器人"像人一样说话",我们先要教它学习,通过大量的学习之后,它才能对事物做出分辨。

在AI领域,教机器人学习必须有大量的训练集和测试集,训练集通俗说就像是我们学习时做的习题集,测试集像我们考试做的试题。测试集和训练集里的数据必须是支持算法可用的标注数据,而将采集的原始数据变成算法可用数据的过程叫做"数据标注"。即对采集来的文本、图片、语音数据进行梳理、整理、定性的过程。而数据标注专员就成了为人工智能的发展供应重要且源源不断的"数据燃料"的人。

云知声就有一个庞大的数据标注团队从事数据服务工作,并且,仅有的数据标注团队还在云知声的东南总部厦门公司哦。团队的小伙伴几乎每天默默戴着耳机对着电脑7-8小时,真的是此处无声胜有声!

云知声数据标注团队:我们是怎样教机器人说话的
数据标注是一项重复且繁琐的工作,如果把人工智能比作金字塔,最顶端的是人工智能应用(比如机器人、无人驾驶等),而最底端的则是数据服务,数据服务既是根基,也是人工智能必要且必不可少的一环。

数据标注工作真的像是工厂里的流水线操作吗?只是重复性地对数据进行标注吗?

云知声数据标注团队的负责人许建说,目前人工智能领域对于数据采集和标注的需求量非常大,数据采集后首先进行数据清洗,清洗之后才是数据标注,标注要求尽可能地详尽、清楚,最后的审查阶段对标记的数据进行正确率、精确度、完备性等方面的审查。实际是,数据质量会影响到算法效果,一旦标注人员出现了错误,也会影响到机器犯错。

云知声数据标注团队:我们是怎样教机器人说话的
目前主要有语音、图像、文本、视频数据的采集标注。云知声日常所涉及的是语音的标注,与智能产品进行语音交互和我们平时与人的交流对话相似,在生活中,你可能突然问你身边的人,"小云,现在几点了","现在3点十五分","小云"就是唤醒词,"现在几点了"就是命令词,唤醒词和命令词均要采集。为了让即便带有背景嘈杂声、或是略带方言口音也能准确识别,这背后有一个数量庞大的数据训练集支撑。每个语音命令需要采集至少100人的语音数据,既要罗列出所有可能的句子,又要搜集尽可能多的人不同的说话方式,覆盖到地域、性别、各年龄段。

比如我们的PandoraA1客房智能管家,当查询酒店服务时,就有多种表达方式,"提供什么服务"、"包括哪些服务"、"有哪些服务"、"有什么服务"等。同时,会有严格的性别、年龄段、口音采集人数占比,以保证最终的精准识别。

云知声数据标注团队:我们是怎样教机器人说话的
云知声数据标注团队:我们是怎样教机器人说话的
对每一个采集的词句,都要做到精细标注,采集的语音需要符合相应的技术要求,标注的时间点要精准控制在100毫秒以内。数据标注的速度决定了AI 产品的研发速度,提高标注的效率也就显得很重要。

为了配合数据标注团队的工作厦门展厅还藏着一个神秘的声学实验室,这里可以说是整个公司最安静的地方了。

云知声数据标注团队:我们是怎样教机器人说话的
声学实验室的主要用途是采集原始声音数据,为了贴近产品实际使用场景,整个装修布置符合家居场景。

实验室采用减振隔声墙体,房间被墙体隔开,墙面、吊顶与外部房间没有任何刚性连接,完全与外界隔绝。墙内的吸声材料主要由多孔的玻璃纤维板组成,具有较好的声音吸收能力,除了吸声材料外,声学实验室四周还布置了窗帘,可以让声音充分扩散,使整个空间内的声场均匀分布。地板采用的是地砖和吸声地毯,实现实验室与建筑基座的分隔,无反射和回声。

声学实验室内五脏俱全—标准麦克风、高保真音箱、声卡……应有尽有。

许建说,为了达到设备在实际应用场景中达到最优效果,在声学实验室采集时就要模拟真实环境,需要覆盖不同的噪音、信噪比、距离和角度。

为了保证支持远讲的语音产品出厂前的效果,在前期的采集阶段就要把产品在实际应用中受到的噪音干扰和不同距离、角度的声音效果考虑进去。

云知声数据标注团队:我们是怎样教机器人说话的
云知声数据标注团队:我们是怎样教机器人说话的
像我们有些设备是支持5米远讲识别的,就要求录音人距离录音设备一米、三米、五米距离的录音数据,同时会设置0°、-30°、-60°等不同角度的设备叠加采集。经常在采集的过程中根据场景需要加入音乐噪声、电视噪声、办公噪声、室外噪声等,模拟出真实场景的噪音干扰。

人工智能的发展,催生了数据标注这个新职业,随着人工智能大规模的落地应用,至少在未来的五六年内,人工智能像是一个嗷嗷待哺的婴儿,等待着数据的喂养。数据标注专员赋予冷冰冰的机器以鲜活的"生命",教他们我们的知识,让他们变得有"温度"。



上一篇:猎豹移动Q2财报净利润同比增180% AI机器人业务加速场景落地
下一篇:谷歌发布首批预打包的人工智能服务
精选推荐
麻省理工学院最新研究:优化软体机器人的控制和设计
麻省理工学院最新研究:优化软体机器人的控制和设计

[2019-11-24]  软体机器人属于一个新的领域,它可能在诸如外科手术等领域发挥重要作用(手术时的纳米机器人需要在人体内部移动而不损伤软组织)。软体机器 ...

这些人型机器人是如此真实,你的肉眼几乎无法区分
这些人型机器人是如此真实,你的肉眼几乎无法区分

[2017-09-03]   我们生活在一个区分现实与幻想变得越来越困难的世界。由于机器人技术的进步,创造人工的人类正在逐渐接近完美的最终目标。我们现在看到的机器人不再只是一块发光二极管,......

助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出
助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出

[2017-12-25]  本文提出了一个大型的、长序列的、用于行人重识别的视频数据集,简称LVreID。与现有的同类数据集相比,该数据集具有以下特点:1)长序列:平均每段视频序列长为200帧,包含丰......

智能机器人困惑的时候知道该问什么问题
智能机器人困惑的时候知道该问什么问题

[2017-03-20]   照片:Nick Dentamaro 布朗大学 上周,我们提到了麻省理工学院的一些研究,即通过链接人的大脑来帮助机器人在他们将要犯错误的时 ...

机器人工程师具体都做什么?
机器人工程师具体都做什么?

[2017-12-08]  机器人工程师是幕后设计师,负责创建机器人和机器人系统,能够执行人类无法完成或不愿意完成的任务。 通过他们的创造,机器人工程师帮助工作更安全,更轻松,更高效,特别是......

如何让人工智能机器人快速自我纠正错误并吃一堑长一智?
如何让人工智能机器人快速自我纠正错误并吃一堑长一智?

[2017-08-23]  莱斯特大学数学系的研究人员在《Neural Networks》杂志上发表了一篇文章,概述了新算法的数学基础,可以使人工智能收集错误报告并立即纠正,而不影响现有技能 ,同时还会积......

美国普渡大学研发快动作软体机器人,灵感来自变色龙舌头捕食
美国普渡大学研发快动作软体机器人,灵感来自变色龙舌头捕食

[2019-10-31]  本文图片均来自:Ramses v Martinez 普渡大学变色龙、蝾螈和许多蟾蜍利用积蓄的弹性能量,向距离1 5倍体长的毫无防备的昆虫伸出粘糊糊的舌 ...

基于生物启发的机器人很容易适应丢失附属器官
基于生物启发的机器人很容易适应丢失附属器官

[2017-12-17]  很多机器人被设计应用在危险环境,如灾难现场。在这些地方,他们的运动系统完全有可能被损坏。那这样会吓跑这些机器人吗?也许不是,如果它们像日本的东北和北海道大学创造的......

本周栏目热点

[2018-12-26]  目前京东X事业部已经成功推出仓储机器人、无人机和交付机器人等多种产品。最近,京东正在开发新的人工智能交付机器人,以便于将货物从仓库运送给客户,完成最后一公里的交付。...

幻尔科技获千万元天使轮融资 欲打通全年龄机器人教育体系

[2018-05-24]  原标题:36氪首发|想打通全年龄机器人教育体系,「幻尔科技」获千万元天使轮融资孩子的潜力是巨大的。随着教育观念的变化和社会群体的变迁 ...

盘点20家外骨骼机器人公司,人类离钢铁侠不远了

[2018-04-03]  要说机器人研究哪家强,哈佛的机器人研究绝对首屈一指,无论是仅有86克的微型机器人RoboBee,还是靠着体内化学反应自驱动的软体章鱼机器人 ...

人形机器人巅峰ASIMO之死 本田正式放弃开发

[2018-07-02]  日本NHK电视台6月28日报道,日本汽车制造巨头本田已经停止继续开发可用双足步行的人型机器人“ASIMO”(阿西莫)。今后,本田将致力于研发可提供看护护理等更为实用的机器人技术......

重磅:苹果人工智能最完整解密,iBrain早已无处不在

[2016-09-04]   编者按: 眼下最受关注的技术非 人工智能 莫属,但全球市值最高的公司 苹果 似乎对此无动于衷,被认为在 人工智能 领域严重落后,除了语 ...