爱吧机器人网 » 技术 > 模式识别 > 正文

谷歌语音识别想超过人类,方法是借助神经网络

导语:彭博社今天撰文称,谷歌正在 语音识别 领域展开野心勃勃的尝试,希望通过技术手段实现超越人类的 语音识别 能力。

以下为文章全文:

与数字助理交流是一件有趣的事情,它给人的感觉就像固执的孩童。如果你曾经对着Xbox或Siri大喊大叫,你或许已经失去希望。

但研究人员表示, 语音识别 和 人工智能 领域最近取得的突破,很快就能大幅提升这些电子产品的理解力,使之更好地与我们展开沟通。谷歌工程师约翰·沙尔克维克(Johan Schalkwyk)表示,这种全新的设备不仅能听懂我们的意思,还能结合上下文和语调的细微差别理解深层含义。

沙尔克维克正在谷歌从事一项野心勃勃的研究项目,希望创造一套能够利用该公司海量数据的语音系统。他表示,他们目前正在实验室里测试的一个项目,使得电脑可以听懂并“思考”人们的语言。

最近在 语音识别 和 机器学习 领域的各种发明,将给 语音识别 带来巨大变化。Siri的一位主要发明人表示,工程师都在狂热地开发 语音识别 技术,使之具备足够的智能,与用户展开真正的对话。“ 语音识别 的所有领域都已经实现了很大进步。”Siri底层技术开发公司SRI International副总裁威廉·马克(William Mark)说,“这种对话互动目前已经成为前沿技术。”

蒂姆·图塔尔(Tim Tuttle)等待这一天已经很久了。他1997年获得了麻省理工学院的博士学位,并任职于该校的 人工智能 实验室。10年来,他先后在硅谷多家公司任职,最终于2010年创办了自己的Except Labs公司。图塔尔的公司去年开始设计一套系统,向移动应用中增加复杂的语音指令。例如,当用户走进超市时,可以通过这项功能获知他要买的扫帚位于哪条走廊。

谷歌 语音识别 Google Now

“一年前,我们在做基准,我们当时认为这不可能实现。但一切都变了。我们的公司已经对语音加倍下注,主要是因为近期所看到的各种技术进步。”图塔尔说,“与人类水平相当或高于人类水平的 语音识别 系统将实现商业化。”

但首先,还是先来回顾一下历史:两年半以前,谷歌和多伦多大学的研究人员发表了一篇颇有影响力的论文,内容是用“深度 神经网络 ”来指导计算机语音技术。几个月后,微软与IBM也合作发表了另外一篇论文,被谷歌工程师杰夫·迪恩(Jeff Dean)称作“语音研究领域20年来的最大进步”。

这些研究使得一项数十年前诞生的数字 神经网络 发明再度复活。这项技术1980年代就在 大数据 预测和分析领域实现了不俗的表现,但当时却受到计算机速度的制约。 神经网络 直到最近才变成可行的方案,这主要得益于计算机处理速度的加快,以及新型软件模式的发展。

谷歌实验室也开展了类似的研究。6个月前,该团队从这种名为“前馈 神经网络 ”的古老方法入手,推动了 神经网络 技术的复活。这项技术使得系统可以储存更多信息,并处理更长、更复杂的序列。谷歌这项突破源自对底层代码的简化,可以在同一套系统中保留更多观点和观念,从而让用户更容易问出复杂的问题,获得有意义的答案。“系统复杂性可能对长期发展构成伤害。”沙尔克维克说。

谷歌的系统目前使用上下文、物理位置和其他因素进行假设,以此判断语音的真正含义——整个过程与人类大脑的思维模式相仿。谷歌的最新网络技术可以提升这一过程的效率,从而处理比以往更大的数据量,回答更复杂的问题。

为了解释 语音识别 技术在未来的工作方式,沙尔克维克提到了谷歌山景城总部几公里之外的一间高级越南餐厅。这家名为Xanh Restaurant的餐厅对典型的 语音识别 构成了挑战,因为Xanh这个名字(发音为“扎恩”)很难识别。“如果我能找到它在地图上的位置,然后说,‘这是一家餐馆,它位于加州。’那么范围就会立刻缩校”沙尔克维克说,“借助语义技术,我们便可大幅改善质量。”

这听起来似乎很简单,但对电脑来说,听到一个单词,然后把它放到句子上下文中去辨识,再与地理信息相结合,是十分困难而且耗费时间的。如今,谷歌语音搜索已经可以正确识别餐馆。沙尔克维克表示,谷歌今后将可以处理其他一些同样野心勃勃的问题。

沙尔克维克表示,在谷歌内部, 语音识别 技术已经实现了空前的进步。虽然谷歌的重大进步还要再等一两年才能应用到用户的手机中,但这个项目已经催生了很多可以应用于谷歌其他项目的技术。“开发登月项目的同时,还会同时设计出另外一百项有用的技术。”沙尔克维克说。

沙尔克维克表示,谷歌 语音识别 技术3年前只能认出3/4的口语单词。但得益于创新速度的加快,谷歌手机应用现在可以正确识别12/13的单词。据图塔尔介绍,要不了多久,“我们就将生活在一个没有键盘的世界里。”


上一篇:人脸识别技术未来或将成安防产业新星
下一篇:人机交互技术:2015指纹识别将大爆发
精选推荐
苹果AI主管透露自动驾驶汽车项目关于机器学习方面的进展
苹果AI主管透露自动驾驶汽车项目关于机器学习方面的进展

[2017-12-11]  苹果隐秘的自动驾驶汽车项目多年来一直在转移焦点,但今年似乎正在加速。 4月份,公司获得了在加利福尼亚州进行自动驾驶汽车测试的许可证,而在6月份,苹果公司首席执行官库......

基于生物启发的机器人很容易适应丢失附属器官
基于生物启发的机器人很容易适应丢失附属器官

[2017-12-17]  很多机器人被设计应用在危险环境,如灾难现场。在这些地方,他们的运动系统完全有可能被损坏。那这样会吓跑这些机器人吗?也许不是,如果它们像日本的东北和北海道大学创造的......

谷歌宣布搜索算法重大升级,用BERT模型理解用户搜索意图
谷歌宣布搜索算法重大升级,用BERT模型理解用户搜索意图

[2019-10-26]  谷歌刚刚宣布,其搜索引擎的核心算法正在进行一项重大升级,这项升级可能会改变10%的搜索结果排序。此项升级应用了自然语言处理技术(BERT ...

全自动膝关节置换手术机器人被美国FDA批准上市
全自动膝关节置换手术机器人被美国FDA批准上市

[2019-10-14]  美国Think Surgical公司已获得美国食品和药物管理局(FDA)的批准,在美国销售用于全膝关节置换(TKA)的TSolution One®全膝关节应用 ...

科学家从蟑螂获得启发 教机器人更好地走路
科学家从蟑螂获得启发 教机器人更好地走路

[2017-12-11]  Weihmann指出:“我特别感到惊讶的是,动物运动稳定机制的变化与腿部协调的变化是一致的。昆虫的慢运行非常稳定,因为它的重心很低,三条腿总是以协调的方式运动。...

麻省理工最新机器人“装配工”未来可建造太空基地
麻省理工最新机器人“装配工”未来可建造太空基地

[2019-10-17]  两个机器人原型把一系列小单元组装成大结构体麻省理工学院科研人员最近提出一种新型机器人技术,即一种小型机器人系统,能够自主地用统一规 ...

可编辑神经网络,有望简化深度学习?
可编辑神经网络,有望简化深度学习?

[2019-10-04]  深度学习是一个计算繁重的过程。 降低成本一直是 Data curation 的一大挑战。 关于深度学习神经网络大功耗的训练过程,已经有研究人员 ...

美国人工智能公司Skymind进入福建全面开展业务
美国人工智能公司Skymind进入福建全面开展业务

[2017-12-11]  人工智能在当今这个时代对大家来说想必是非常熟悉的,这也是我国近十几年来一直追求的目标,未来的时间里这也将是全人类追求的目标。就目前来看,近年来,人工智能或在我国迎......

本周栏目热点

苹果公司收购Regaind人工智能初创公司

[2017-10-01]  要说新一代的iPhone有什么新的黑科技,那么就一定要说到配备在iPhone X身上的人脸识别技术了,可以说,这是目前iPhone的最新也是最为惹人 ...

Facebook信使测试语音转换文字功能

[1970-01-01]   Facebook正在测试一项新的功能,该功能是Facebook信使应用的部分功能,它可以自动将语音信息转换为文字 ...

人脸识别:离生活越来越近

[1970-01-01]   你来到家门口,不用再在包里翻来翻去找钥匙,对着门前的 人脸识别 系统刷脸确认身份,便可进门;在超市 ...

人机交互技术:2015指纹识别将大爆发

[1970-01-01]   各项关于人机交互的技术正在不断发展、日益成熟,明年 指纹识别 技术将得到大爆发。所谓指纹辨识,顾名思 ...

科大讯飞第一季营收1.7亿 中移动成单一大股东

[1970-01-01]   4月24日消息,科大讯飞(股票代码:002230)昨日发布公告,公告显示,科大讯飞2013年第一季度营收1 73 ...