爱吧机器人网 » 技术 > 模式识别 > 正文

语音交互什么时候可以渗透到生活中?

语音交互什么时候可以渗透到生活中?

从2011年10月4日,苹果在iPhone4s机型上开创性地配置Siri语音控制功能,并相继在2012年宣布支持中文语音识别和互动开始,语音助手浪潮首先在手机端应用掀起。

经过五年的发展,原本通过手动的人机交互模式已衍生出许多口令式应用场景,与此同时,在炙手可热的智能家居市场中,以语音交互为基础的人机互动模式也逐步成为标准性功能配置。

虽然,语音交互领域俨然被吹捧为又一智能蓝海、智能领域的入口之一,国内外科技大佬也因此没少在其投钱。

然而,回到现实应用场景里,我们当中有多少人真的像手动触屏操作那样信任语音助手?一天中有多少次开启过语音互动功能?从我们身边的用户和自身的使用习惯看,用户对语音操控仍然极度缺乏信任。

当今语音技术格局

从语音智能生态系统来看,主要有基于Nuance的苹果Siri与三星S-Voice、谷歌Android的Google Now、微软Windows Phone的Cortana三大版图。专注于中文语音智能领域而言:

以传统的语音技术提供商科大讯飞为首,无论在技术还是市场者占有领先地位,已知的合作厂商如京东微联、锤子科技、长虹、创维、三星等家电厂商;

腾讯,百度两大科技巨头也通过其团队实力的优越性展现了后来者居上的姿态;

苏州思必驰,捷通华声,云知声等相对较年轻的技术服务商在整体识别率十分抢眼;以及一些背靠其他学术或技术团队的小公司也正在积聚力量。

基础:手机使用场景

从iPhone的Siri开始,通过语音助手在手机上实现读短信、介绍餐厅、询问天气、设置闹钟、自然语言输入、调用天气预报、日程安排、搜索资料等功能已不再新鲜,通过后期的技术迭代,学习新的声音和语调,提供对话式的应答等能力也不在话下。

同时,在应用类层面,如微信、新浪微博、语音搜索、365日历、掌阅、91熊猫看书以及各大导航类应用也全面引入了语音识别、语义理解等功能。

潜力:家居物联网

随着物联时代的兴起,家居物联这块蓝海市场也吸引了众多科技公司的押注,而其最基本的接入方式。

在国外,三大科技大佬已开始布局,苹果就在今年6月初的苹果全球开发者大会(WWDC)上,推出了自家首个智能家居平台Homekit,其亮点也正是整合了Siri——具有语音控制功能,对于借用第三方应用或其它硬件而实现智能操控的国内智能家居系统无疑更容易打动用户。

与此同时,微软近日也宣布将把微软语音助手Cortana引入家庭自动化设备制造商Insteon在Windows Phone的应用程序中。

而谷歌早在去年也通过收购收购Nest Labs成功进军智能家居市场,并在今年5月份的谷歌I/O开发者大会上推出了以Android为核心的Brillo系统,以及Google Now新的智能应用功能。

国内市场方面,借由语音交互功能作为物联家居的入口、以及通过类似布丁机器人等家庭机器人的人机语音互动入驻智能家居等模式也屡见不鲜。

所谓的“标配”真的实用吗?

如果仅从配置要求方面而言,如上所述,语音智能技术确实已成为主流,但根据相关数据显示这一功能的使用率并不高。

在大多数情况下,语音交互变成了消遣娱乐的“游戏”,并未成为真正帮助人们操控设备的工具。究其原因,笔者认为主要在以下几个方面:

1. 语音识别率、语义理解力不足。虽然国外有迭代数次的苹果Siri语音助手、以及谷歌、微软等硬实力派的加盟,但据业界人士表示,从目前语音识别率提升至99%甚至100%的路还很长。这主要是语音易受场合、情绪、身体状况、内容上下文等影响的特性决定;

2. 中文语音的复杂性。由于中文的复杂性,其语音、语调、方言等多重因素的影响,造成汉语语音识别比英语在准确性更具挑战,以及在不同的语境内使用不同的字和语气,甚至包括隐语之类的东西,在英文里都是很少有的,所以偏重英文识别性能的外国技术在中文语音识别和语义理解方面显得“水土不服”,而这一点也需我国自主技术厂商的努力;

3. 缺少极为匹配的应用场景。虽然智能语音功能已在车载、智能家居、手机端等场景中实现,但更多的情况是为了添加语音互动功能而硬造出的应用场景;与此同时,不同机型在语音识别率、反应速度、功耗方面差异巨大且存在诸多问题,这一点使得智能语音功能在产品应用上更显鸡肋;

4. 此外,为使用户更好地实现语音操作的过渡和转化,在语音技术与触控、体感等其他操控方式的结合也显得十分重要,如果简单地将之定位于触摸、按键等主流操作方式的替代品,必将导致较低的市场接受。

目前的语音操控仍面临很多亟待解决的问题,用户实际应用情况并不像其产品覆盖面那样广泛,即所谓的语音智能还并不能称之为真正的标配。

但不可否认,语音交互已作为人机交互发展的重要方向,正逐步渗入到我们的日常生活与应用当中,引起了智能硬件行业的变革。

而谁能率先为智能语音交互创造更人性化的操作体验,在其算法的准确率、反应时间以及处理性能进行实质性的突破,定将为智能领域的发展创造丰厚的附加值。


上一篇:Face++CEO印奇:怎样做好人脸识别
下一篇:中国人脸识别水平可比肩美国、以色列
精选推荐
美国人工智能公司Skymind进入福建全面开展业务
美国人工智能公司Skymind进入福建全面开展业务

[2017-12-11]  人工智能在当今这个时代对大家来说想必是非常熟悉的,这也是我国近十几年来一直追求的目标,未来的时间里这也将是全人类追求的目标。就目前来看,近年来,人工智能或在我国迎......

科学家从蟑螂获得启发 教机器人更好地走路
科学家从蟑螂获得启发 教机器人更好地走路

[2017-12-11]  Weihmann指出:“我特别感到惊讶的是,动物运动稳定机制的变化与腿部协调的变化是一致的。昆虫的慢运行非常稳定,因为它的重心很低,三条腿总是以协调的方式运动。...

7种常见的机器人焊接类型
7种常见的机器人焊接类型

[2017-12-17]  机器人焊接是工业领域最常见的机器人应用之一,近几十年来主要由汽车行业驱动。机器人焊接在完成大批量,重复性的焊接任务时效率最高。...

2017年:AI渗入云端
2017年:AI渗入云端

[2017-12-29]  云中的人工智能不仅仅是科技巨头的权力游戏,它也可能是人工智能领域的下一个飞跃。加利福尼亚州的Rigetti Computing公司刚刚使用其原型量子芯片之一在其云平台上运行机器学......

什么是机器人学?机器人学简介
什么是机器人学?机器人学简介

[2017-12-14]  机器人学是工程学与科学的交叉学科,包括机械工程,电气工程,计算机科学等。机器人技术涉及机器人的设计、制造、操作和应用,以及用于控制、感官反馈和信息处理的计算机系统。...

苹果AI主管透露自动驾驶汽车项目关于机器学习方面的进展
苹果AI主管透露自动驾驶汽车项目关于机器学习方面的进展

[2017-12-11]  苹果隐秘的自动驾驶汽车项目多年来一直在转移焦点,但今年似乎正在加速。 4月份,公司获得了在加利福尼亚州进行自动驾驶汽车测试的许可证,而在6月份,苹果公司首席执行官库......

从AI中窥探人性
从AI中窥探人性

[2018-01-03]  人们对人造智能的恐惧早已成为科幻书籍和电影的极好题材。但现在,一些同样的担忧开始影响关于现实世界AI技术的政策讨论。如果这样的担忧演变成为一种技术恐慌...

新型轻便机器人套装重5kg,辅助跑步和步行
新型轻便机器人套装重5kg,辅助跑步和步行

[2019-10-23]  虽然步行对大多数人来说似乎不是负担,但对有些人来说,这项简单的运动往往会让人感到筋疲力尽。比如手术或中风后恢复的患者、帕金森氏症患 ...

本周栏目热点

生物识别技术那么多,为啥偏偏“刷脸”火了

[1970-01-01]   你走到一家自助银行前,摄像头通过刷脸,自动识别你的身份为你开门;你站到ATM机前输入密码,再在摄像 ...

NEC人脸识别技术致力服务公共安全

[1970-01-01]   沸沸扬扬的哈尔滨看守所杀警越狱事件随着最后一名案犯的落网而尘埃落定,但是围绕这起案件的深度讨论却 ...

从原理入手,解析基于DSP的汉字语音识别系统的实现方式

[1970-01-01]   语音识别是机器通过识别和理解过程把语音信号转变为相应的文本文件或命令的高技术。作为专门的研究领域 ...

谷歌为何力推虹膜技术 分析其背后的价值链条-模式识别

[2015-12-11]   指纹识别、人脸识别技术正在趋于成熟,也正在被应用到更丰富的场景,逐渐改变我们生活的方方面面。但在 ...

在移动互联网上,图像识别Face++可以做什么?

[1970-01-01]   在互联网上,没人知道你是一条狗。这是1993年《纽约客》杂志关于互联网匿名性的经典论述。时光荏苒,二 ...