爱吧机器人网 » 技术 > 模式识别 > 正文

百度研究出深度学习语音识别系统DeepSpeech,嘈杂环境下

不久前,百度的首席科学家吴恩达(Andrew Ng)在接受采访时曾谈到了百度最近 人工智能 项目的进展情况,强调了近期百度重点是攻关 语音识别 。现在他们已经在这方面取得了突破。

这项成果的名字叫做Deep Speech,是一款采用深度学习技术的 语音识别 系统系统。其独特之处在于,它可以在饭店等嘈杂环境下实现将近81%的辨识准确率。

81%的准确率听起来似乎不算高。但是同样环境下,其他的商业版 语音识别 API,包括Bing、Google以及Wit.AI等的最高识别率也只有65%。相比之下这就算十分突出的表现了。而且按照吴恩达的说法,这样的结果依然低估了Deep Speech与其他 语音识别 系统的准确率差异,因为Deep Speech进行比较时还把其他 语音识别 系统那些返回空白字符串的结果排除在外了。而且Deep Speech跟顶级的学术型 语音识别 模型(基于流行的数据集Hub5 00建模)相比也高出9个百分点。

百度首席科学家吴恩达称尽管这还只是一项研究,但是公司正在考虑将它集成到供智能手机和Baidu Eye之类的可穿戴设备使用的 语音识别 软件当中。而且百度还在开发与Amazon Echo类似、集成有语音助手的家电产品,名字叫做CoolBox。除此以外,百度在开发的智能自行车当然也能利用Deep Speech技术。

Deep Speech的基础是某种递归 神经网络 (RNN),这种递归 神经网络 经常被用于 语音识别 和文本分析。

但是Deep Speech的成功主要得益于一个长达10万小时的语音数据训练集。这是百度 人工智能 实验室团队用新颖的办法在嘈杂环境下建立的。其过程大致是这样的。首先百度收集了7000小时的语音会话数据,然后再将这些语音文件与包含有背景噪音的文件合成到一起,最后形成约10万小时的训练集。这些背景噪音包括了饭店、电视、自助餐厅以及汽车内、火车内等场景。相比之下,Hub5 00的数据集总共只有2300小时。

当然,这么庞大的数据大多数系统都不知道如何去处理。吴恩达表示,Deep Speech的成功很大程度上要取决于百度规模庞大的基于GPU的深度学习基础设施。GPU(图形处理器)往往是偏数学型计算的首眩许多深度学习系统都采用GPU避免通信瓶颈(不过微软的深度学习系统Adam 却走了不同的路线),但是像百度这样大规模的设施却是少见的。

百度的另一大改进,是对这个庞大的数据集采用了端到端的深度学习模型,而不是标准的、计算代价高昂的声学模型。传统上一般都会把 语音识别 分别为多个步骤,其中一步叫做语音调适,但是百度却不做这一步,而是给Deep Speech的 算法 提供大量的数据,然后让它去学习所有需要学习的东西。这种做法除了收获了准确率以外,还显著减少了代码库的规模。

这项研究是吴恩达领导的百度 人工智能 实验室多位研究人员的努力成果,论文发表在了康奈尔大学图书馆的arXiv.org网站上,感兴趣的可到此处下载。


上一篇:灵云语音识别(ASR)升级用户体验大幅提升
下一篇:用声音登录微信 新版微信增添了一些实用功能
精选推荐
美国Natilus公司试飞水上无人货机 设计简单成本降低
美国Natilus公司试飞水上无人货机 设计简单成本降低

[2017-12-28]  Natilus创业公司成立于2014年,其梦想是建造大型无人机,以半价提供比船舶快得多国际货运。在十二月份,Natilus计划在旧金山湾测试一个9米翼展的小型原型无人机的水上滑行能力......

南加州大学机器人学家:机器人更适合粗暴的爱
南加州大学机器人学家:机器人更适合粗暴的爱

[2019-11-07]  图片来自JOHN MADERE GETTY IMAGES打是疼骂是爱,当人类粗暴的将物体从机器人手中敲掉,看似残忍,实际上却能帮助机器人找到最好的握持物 ...

新型轻便机器人套装重5kg,辅助跑步和步行
新型轻便机器人套装重5kg,辅助跑步和步行

[2019-10-23]  虽然步行对大多数人来说似乎不是负担,但对有些人来说,这项简单的运动往往会让人感到筋疲力尽。比如手术或中风后恢复的患者、帕金森氏症患 ...

谷歌大脑发布ROBEL基准 鼓励用低成本机器人训练AI系统
谷歌大脑发布ROBEL基准 鼓励用低成本机器人训练AI系统

[2019-10-11]  训练AI系统的机器人D& 39;Claw和D& 39;Kitty用于控制机器人的人工智能系统,测量其性能所使用的基准通常仅限于为工业环境设计的昂贵硬件, ...

比利时研发出可以自我愈合伤口的软体机器人
比利时研发出可以自我愈合伤口的软体机器人

[2017-09-03]  软体机器人是机器人技术的新兴领域; 他们“可以与人类相互作用,而不会杀死他们,并拿起像西红柿这样柔软的物体。” 从长远来看,布鲁塞尔大学队伍正在努力创建一个类似的材......

机器人灵巧手将成为智能机器人的下一个重大突破
机器人灵巧手将成为智能机器人的下一个重大突破

[2018-01-25]  计算机科学教授兼东北地区助手机器人实验室负责人罗伯特·普拉特(Robert Platt)说:“机器人手操作是下一步要解决的问题。想象一下,一个机器人可以在现实世界中用手去做事......

英国首台月球车是个小型四腿机器人 将于2021年登月
英国首台月球车是个小型四腿机器人 将于2021年登月

[2019-10-12]  探测器将用四条腿探测月球表面,并将数据传回着陆器,后者将把数据传回地球图 詹姆斯温斯皮尔英国即将成为继美国、俄罗斯、中国之后的又一 ...

[2018-01-26]  纽约时报的报道,德国的研究人员已经开发出一种长约七分之一英寸的机器人,首先看起来不过是一小块橡皮条。然后它开始移动。机器人走路,跳跃,爬行,滚动和游泳。它甚至爬出......

本周栏目热点

苹果公司收购Regaind人工智能初创公司

[2017-10-01]  要说新一代的iPhone有什么新的黑科技,那么就一定要说到配备在iPhone X身上的人脸识别技术了,可以说,这是目前iPhone的最新也是最为惹人 ...

Facebook信使测试语音转换文字功能

[1970-01-01]   Facebook正在测试一项新的功能,该功能是Facebook信使应用的部分功能,它可以自动将语音信息转换为文字 ...

人脸识别:离生活越来越近

[1970-01-01]   你来到家门口,不用再在包里翻来翻去找钥匙,对着门前的 人脸识别 系统刷脸确认身份,便可进门;在超市 ...

人机交互技术:2015指纹识别将大爆发

[1970-01-01]   各项关于人机交互的技术正在不断发展、日益成熟,明年 指纹识别 技术将得到大爆发。所谓指纹辨识,顾名思 ...

科大讯飞第一季营收1.7亿 中移动成单一大股东

[1970-01-01]   4月24日消息,科大讯飞(股票代码:002230)昨日发布公告,公告显示,科大讯飞2013年第一季度营收1 73 ...