爱吧机器人网 » 技术 > 模式识别 > 正文

语音交互什么时候可以渗透到生活中?

语音交互什么时候可以渗透到生活中?

从2011年10月4日,苹果在iPhone4s机型上开创性地配置Siri语音控制功能,并相继在2012年宣布支持中文语音识别和互动开始,语音助手浪潮首先在手机端应用掀起。

经过五年的发展,原本通过手动的人机交互模式已衍生出许多口令式应用场景,与此同时,在炙手可热的智能家居市场中,以语音交互为基础的人机互动模式也逐步成为标准性功能配置。

虽然,语音交互领域俨然被吹捧为又一智能蓝海、智能领域的入口之一,国内外科技大佬也因此没少在其投钱。

然而,回到现实应用场景里,我们当中有多少人真的像手动触屏操作那样信任语音助手?一天中有多少次开启过语音互动功能?从我们身边的用户和自身的使用习惯看,用户对语音操控仍然极度缺乏信任。

当今语音技术格局

从语音智能生态系统来看,主要有基于Nuance的苹果Siri与三星S-Voice、谷歌Android的Google Now、微软Windows Phone的Cortana三大版图。专注于中文语音智能领域而言:

以传统的语音技术提供商科大讯飞为首,无论在技术还是市场者占有领先地位,已知的合作厂商如京东微联、锤子科技、长虹、创维、三星等家电厂商;

腾讯,百度两大科技巨头也通过其团队实力的优越性展现了后来者居上的姿态;

苏州思必驰,捷通华声,云知声等相对较年轻的技术服务商在整体识别率十分抢眼;以及一些背靠其他学术或技术团队的小公司也正在积聚力量。

基础:手机使用场景

从iPhone的Siri开始,通过语音助手在手机上实现读短信、介绍餐厅、询问天气、设置闹钟、自然语言输入、调用天气预报、日程安排、搜索资料等功能已不再新鲜,通过后期的技术迭代,学习新的声音和语调,提供对话式的应答等能力也不在话下。

同时,在应用类层面,如微信、新浪微博、语音搜索、365日历、掌阅、91熊猫看书以及各大导航类应用也全面引入了语音识别、语义理解等功能。

潜力:家居物联网

随着物联时代的兴起,家居物联这块蓝海市场也吸引了众多科技公司的押注,而其最基本的接入方式。

在国外,三大科技大佬已开始布局,苹果就在今年6月初的苹果全球开发者大会(WWDC)上,推出了自家首个智能家居平台Homekit,其亮点也正是整合了Siri——具有语音控制功能,对于借用第三方应用或其它硬件而实现智能操控的国内智能家居系统无疑更容易打动用户。

与此同时,微软近日也宣布将把微软语音助手Cortana引入家庭自动化设备制造商Insteon在Windows Phone的应用程序中。

而谷歌早在去年也通过收购收购Nest Labs成功进军智能家居市场,并在今年5月份的谷歌I/O开发者大会上推出了以Android为核心的Brillo系统,以及Google Now新的智能应用功能。

国内市场方面,借由语音交互功能作为物联家居的入口、以及通过类似布丁机器人等家庭机器人的人机语音互动入驻智能家居等模式也屡见不鲜。

所谓的“标配”真的实用吗?

如果仅从配置要求方面而言,如上所述,语音智能技术确实已成为主流,但根据相关数据显示这一功能的使用率并不高。

在大多数情况下,语音交互变成了消遣娱乐的“游戏”,并未成为真正帮助人们操控设备的工具。究其原因,笔者认为主要在以下几个方面:

1. 语音识别率、语义理解力不足。虽然国外有迭代数次的苹果Siri语音助手、以及谷歌、微软等硬实力派的加盟,但据业界人士表示,从目前语音识别率提升至99%甚至100%的路还很长。这主要是语音易受场合、情绪、身体状况、内容上下文等影响的特性决定;

2. 中文语音的复杂性。由于中文的复杂性,其语音、语调、方言等多重因素的影响,造成汉语语音识别比英语在准确性更具挑战,以及在不同的语境内使用不同的字和语气,甚至包括隐语之类的东西,在英文里都是很少有的,所以偏重英文识别性能的外国技术在中文语音识别和语义理解方面显得“水土不服”,而这一点也需我国自主技术厂商的努力;

3. 缺少极为匹配的应用场景。虽然智能语音功能已在车载、智能家居、手机端等场景中实现,但更多的情况是为了添加语音互动功能而硬造出的应用场景;与此同时,不同机型在语音识别率、反应速度、功耗方面差异巨大且存在诸多问题,这一点使得智能语音功能在产品应用上更显鸡肋;

4. 此外,为使用户更好地实现语音操作的过渡和转化,在语音技术与触控、体感等其他操控方式的结合也显得十分重要,如果简单地将之定位于触摸、按键等主流操作方式的替代品,必将导致较低的市场接受。

目前的语音操控仍面临很多亟待解决的问题,用户实际应用情况并不像其产品覆盖面那样广泛,即所谓的语音智能还并不能称之为真正的标配。

但不可否认,语音交互已作为人机交互发展的重要方向,正逐步渗入到我们的日常生活与应用当中,引起了智能硬件行业的变革。

而谁能率先为智能语音交互创造更人性化的操作体验,在其算法的准确率、反应时间以及处理性能进行实质性的突破,定将为智能领域的发展创造丰厚的附加值。


上一篇:Face++CEO印奇:怎样做好人脸识别
下一篇:中国人脸识别水平可比肩美国、以色列
精选推荐
搭载人工智能的太空机器人CIMON 2乘SpaceX抵达国际空间站
搭载人工智能的太空机器人CIMON 2乘SpaceX抵达国际空间站

[2019-12-09]  12月5日,搭载人工智能的太空机器人西蒙2号(CIMON 2)乘坐SpaceX火箭Dragon货运舱,从佛罗里达州卡纳维拉尔角空军基地升空,前往国际空间 ...

改变保险市场的格局:无人机如何通过更快的估算、响应时间和利益交付来使消费者受益
改变保险市场的格局:无人机如何通过更快的估算、响应时间和利益交付来

[2018-12-08]  市场研究公司IHS Markit预测,到2020年,专业无人机市场将通过农业,能源和建筑等行业利用测量,制图,规划等技术实现77 1%的复合年增长率(CAGR)。与此同时,消费者无人......

九台“猎豹”机器人组队踢球,麻省理工高材生们的高级趣味
九台“猎豹”机器人组队踢球,麻省理工高材生们的高级趣味

[2019-11-09]  本周,在麻省理工学院10号楼外草坪上展开了一场别开生面的足球比赛。在绿草如茵的基利安球场上,一群由人工智能驱动的机器人就是这场比赛的 ...

智能机器人困惑的时候知道该问什么问题
智能机器人困惑的时候知道该问什么问题

[2017-03-20]   照片:Nick Dentamaro 布朗大学 上周,我们提到了麻省理工学院的一些研究,即通过链接人的大脑来帮助机器人在他们将要犯错误的时 ...

谷歌宣布搜索算法重大升级,用BERT模型理解用户搜索意图
谷歌宣布搜索算法重大升级,用BERT模型理解用户搜索意图

[2019-10-26]  谷歌刚刚宣布,其搜索引擎的核心算法正在进行一项重大升级,这项升级可能会改变10%的搜索结果排序。此项升级应用了自然语言处理技术(BERT ...

英伟达用联合学习创建医学影像AI 可共享数据和保护隐私
英伟达用联合学习创建医学影像AI 可共享数据和保护隐私

[2019-10-14]  英伟达(Nvidia)和伦敦国王学院(King’s College London)的人工智能研究人员利用联合学习训练了一种用于脑肿瘤分类的神经网络, ...

亚马逊CEO杰夫·贝佐斯操控巨型有人驾驶机器人(巨型机甲)
亚马逊CEO杰夫·贝佐斯操控巨型有人驾驶机器人(巨型机甲)

[2017-03-21]  近日,亚马逊CEO杰夫·贝佐斯实现了每一个6岁儿童都会有的梦想,他控制了一个巨大的机甲机器人。据国外媒体Verge报道,前天(3月19日),贝 ...

MIT用深度学习处理3D点云数据 应用于无人汽车等领域
MIT用深度学习处理3D点云数据 应用于无人汽车等领域

[2019-10-23]  如果你见过自动驾驶汽车,也许会对车顶上那个一直在旋转的圆柱体感到好奇。这是一个雷达传感器,无人驾驶汽车依靠它在现实世界中进行导航。 ...

本周栏目热点

苹果公司收购Regaind人工智能初创公司

[2017-10-01]  要说新一代的iPhone有什么新的黑科技,那么就一定要说到配备在iPhone X身上的人脸识别技术了,可以说,这是目前iPhone的最新也是最为惹人 ...

Facebook信使测试语音转换文字功能

[1970-01-01]   Facebook正在测试一项新的功能,该功能是Facebook信使应用的部分功能,它可以自动将语音信息转换为文字 ...

人脸识别:离生活越来越近

[1970-01-01]   你来到家门口,不用再在包里翻来翻去找钥匙,对着门前的 人脸识别 系统刷脸确认身份,便可进门;在超市 ...

人机交互技术:2015指纹识别将大爆发

[1970-01-01]   各项关于人机交互的技术正在不断发展、日益成熟,明年 指纹识别 技术将得到大爆发。所谓指纹辨识,顾名思 ...

科大讯飞第一季营收1.7亿 中移动成单一大股东

[1970-01-01]   4月24日消息,科大讯飞(股票代码:002230)昨日发布公告,公告显示,科大讯飞2013年第一季度营收1 73 ...