爱吧机器人网 » 技术 > 模式识别 > 正文

消灭键盘:谷歌语音新设备两年内面世

技术突破

与数字语音助手聊天产生的乐趣大概就像你努力与一个顽固的孩子讲道理一样。如果你曾经对着你的Xbox大吼,或者咒骂Siri,那说明你可能已经对语音识别失望了。

沙尔克维克正在谷歌从事一项野心勃勃的研究项目,开发能够整合公司海量数据的语音系统。他表示,目前正在实验室测试的一个项目能够使计算机听懂并在本质上“思考”人们向谷歌设备输入的语音。

语音和机器学习领域近期的创新应该会大幅提升语音识别的能力,缓解人们的不满情绪。Siri开发团队中有人表示,工程师们都在狂热地开发语音识别技术,令其足够智能,以实现设备与用户真正地对话。“语音识别技术对所有地区口语的理解能力已取得长足的进步,”Siri底层础技术的开发公司SRI International(后被苹果收购)副总裁威廉·马克(William Mark)称,“这种对话式互动现在成为了一种前沿技术。”

蒂姆·图特勒(Tim Tuttle)对语音识别技术的飞跃等待已久。他在1997年取得了麻省理工学院的博士学位,并在该校人工智能实验室任职。过去10年,他先后在多家硅谷公司工作,并最终在2010年创建了自己的公司Expect Labs。图特勒的公司去年开始从事一个系统研发,将复杂的语音指令加入到移动应用中。这款应用能够允许用户进入一家商店后向手机询问要买的扫帚在哪一条货架走道。

“一年前,我们做了一次基准测试,得出的结论是难以实现这一功能。但是现在,一切都已经发生了改变。我们公司对语音识别进行了加倍投资,主要得益于我们所看到的这些技术进步,”图特勒表示,“你将发现,那些在准确率上与人相当、或比人更高的语音识别系统实现商业化。”

消灭键盘:谷歌语音新设备两年内面世

旧技术获重生

先来迅速回顾一条历史教训:两年半前,谷歌和多伦多大学的研究人员发表了一篇颇有影响力的论文,内容关于使用“深度神经网络”在电脑中模拟语音。几个月后,微软和IBM合作发表了另外一篇论文。谷歌工程师杰夫·迪恩(Jeff Dean)将这两篇论文称之为“语音研究领域20年来取得的最大的一次进步”。

新发现让一项问世数十年的数字神经网络技术创新获得了重生。该技术在上世纪80年代在预测和分析大数据方面表现优异,但发展受制于当时过慢的计算机速度。神经网络在近期才成为一个可行的选择,这要归功于计算机处理速度的大幅提升和新软件技术的发展。

谷歌的实验室项目就是基于神经网络研究。6个月前,谷歌团队放弃了一种名为前馈神经网络的旧方法,转而使用递归神经网络。这一转换使得系统能够存储更多信息,处理更长、更复杂的序列。谷歌的创新成果在于对底层代码的简化,允许软件在相同系统中存储更多观点和概念,使之易于问出复杂的问题和得出合理答案。“系统构建得复杂会损害其长期发展,”沙尔克维克说。

谷歌系统现在使用上下文、物理定位及其它了解到的说话者信息对谈话的场所和真正含义进行预测,就像人在谈话时大脑所做的一样。谷歌的新网络技术应该会更高效,从而能够处理比以往更多的数据,回答更为复杂的请求。

为了解释未来语音识别技术的工作原理,沙尔克维克使用了距离谷歌加州山景城总部几英里之外的高级越南餐馆作为例子。这家餐馆名为Xanh Restaurant。沙尔克维克称,对于典型的语音识别系统来说,识别出这个餐馆名字的发音是个挑战,因为Xanh的发音为“zahn”,识别起来十分困难。“如果我能使用地图,然后说‘这是一家餐馆,它位于加州’,那么可供参考的餐馆数量就会立刻减少很多,”他说,“使用这种语义知识,我们能够大幅改善语音识别的质量。”

这听起来简单,但对于计算机来说,听到一个词汇,从句子中识别上下文,然后根据地理位置分析信息是一件极为困难和耗费时间的事情。如今,谷歌语音搜索能够正确识别餐馆,也许就是因为其开发者是餐馆老顾客的原因。沙尔克维克称,未来谷歌将能处理其他同样存在语音模糊不清的众多问题。

沙尔克维克表示,在谷歌内部,语音识别取得了“数量空前多”的技术进步。尽管谷歌取得的重大进步还需要一到两年时间才能在手机上体现出来,该项目已经催生出了可用于谷歌其他业务的技术。“你开发一些技术准备登月,与此同时,你也开发出了另外100项有用的技术,”沙尔克维克说。

沙尔克维克称,三年前,谷歌语音识别技术或许仅能识别3/4的单词。而如今,图特勒称,得益于创新速度的加快,谷歌手机语音识别应用能够准确猜中12/13的单词。“未来,我们将会生活在一个设备没有键盘的世界里,”图特勒说。


上一篇:谷歌等语音识别技术水平或超人类 暂未投入使用
下一篇:指纹识别技术也不安全:德国防部长指纹轻易被伪造
精选推荐
可编辑神经网络,有望简化深度学习?
可编辑神经网络,有望简化深度学习?

[2019-10-04]  深度学习是一个计算繁重的过程。 降低成本一直是 Data curation 的一大挑战。 关于深度学习神经网络大功耗的训练过程,已经有研究人员 ...

改变保险市场的格局:无人机如何通过更快的估算、响应时间和利益交付来使消费者受益
改变保险市场的格局:无人机如何通过更快的估算、响应时间和利益交付来

[2018-12-08]  市场研究公司IHS Markit预测,到2020年,专业无人机市场将通过农业,能源和建筑等行业利用测量,制图,规划等技术实现77 1%的复合年增长率(CAGR)。与此同时,消费者无人......

新型轻便机器人套装重5kg,辅助跑步和步行
新型轻便机器人套装重5kg,辅助跑步和步行

[2019-10-23]  虽然步行对大多数人来说似乎不是负担,但对有些人来说,这项简单的运动往往会让人感到筋疲力尽。比如手术或中风后恢复的患者、帕金森氏症患 ...

英伟达用联合学习创建医学影像AI 可共享数据和保护隐私
英伟达用联合学习创建医学影像AI 可共享数据和保护隐私

[2019-10-14]  英伟达(Nvidia)和伦敦国王学院(King’s College London)的人工智能研究人员利用联合学习训练了一种用于脑肿瘤分类的神经网络, ...

这些人型机器人是如此真实,你的肉眼几乎无法区分
这些人型机器人是如此真实,你的肉眼几乎无法区分

[2017-09-03]   我们生活在一个区分现实与幻想变得越来越困难的世界。由于机器人技术的进步,创造人工的人类正在逐渐接近完美的最终目标。我们现在看到的机器人不再只是一块发光二极管,......

揭秘达芬奇手术机器人
揭秘达芬奇手术机器人

[2018-04-19]  达芬奇手术系统是由美国Intuitive Surgical公司制造的机器人手术系统。美国食品和药物管理局(FDA)于2000年通过该标准,旨在利用微创手段 ...

麻省理工正研究植物机器人 让植物自主控制机器人
麻省理工正研究植物机器人 让植物自主控制机器人

[2018-12-08]  控制论通常指人类用机器人部件增强自己。我们听说过动物机器人或昆虫机器人,但我们很少听说植物机器人对吧?一个机器人其实是对植物有很大益处的,因为一般植物根本无法移动......

人工神经网络技术解码人类行为和想象时的大脑活动信号
人工神经网络技术解码人类行为和想象时的大脑活动信号

[2017-08-23]  为搜索引擎过滤信息,棋盘游戏对弈,识别图像 人工智能在某些任务中远远超过了人类智能。来自弗莱堡由神经科学家私人讲师Tonio Ball博士领导的几个杰出的BrainLinks-Bra......

本周栏目热点

苹果公司收购Regaind人工智能初创公司

[2017-10-01]  要说新一代的iPhone有什么新的黑科技,那么就一定要说到配备在iPhone X身上的人脸识别技术了,可以说,这是目前iPhone的最新也是最为惹人 ...

Facebook信使测试语音转换文字功能

[1970-01-01]   Facebook正在测试一项新的功能,该功能是Facebook信使应用的部分功能,它可以自动将语音信息转换为文字 ...

人脸识别:离生活越来越近

[1970-01-01]   你来到家门口,不用再在包里翻来翻去找钥匙,对着门前的 人脸识别 系统刷脸确认身份,便可进门;在超市 ...

人机交互技术:2015指纹识别将大爆发

[1970-01-01]   各项关于人机交互的技术正在不断发展、日益成熟,明年 指纹识别 技术将得到大爆发。所谓指纹辨识,顾名思 ...

科大讯飞第一季营收1.7亿 中移动成单一大股东

[1970-01-01]   4月24日消息,科大讯飞(股票代码:002230)昨日发布公告,公告显示,科大讯飞2013年第一季度营收1 73 ...