爱吧机器人网 » 技术 > 模式识别 > 正文

互联网女皇鼓吹的智能语音是下一个创业风口吗?

(一) 语音识别 交互领域,声音一直没有多少存在感

1、相关的技术要求太高。中国人说话远不像老外那样一个单词一个意思,而且各地的口音又完全不同,所以语音的识别、唤醒、输入、交互都是问题,当然强如科大讯飞已经可以破译粤语、上海话、四川话了,但是还会有后面的问题。

2、使用场景有限。视觉和触觉的交互随时随地都可进行,只要你低头悄悄打开手机就行了,但是语音呢,嘈杂的地方不行,人多的地方也不行,甚至晚上一个人了、对着冷冰冰的机器说话,也会有太装太怪的感觉。

3、交互模式不自然。不论是Siri的长按唤醒,还是傻乎乎地“嘿Siri”,感觉都比较违和,当你看着屏幕上Siri正处于“倾听录音”状态,心一下子就紧绷了,生怕说错或者说得不及时,说完以后机器开始识别了,你看着进度条又莫名其妙地焦虑不安起来、它能不能听懂呢,会不会听错呢?结果识别出来,果然是错的,日了狗了……

4、应用生态远未形成。尽管讯飞们已经开始开放语音功能和接口,但市面上并没有出现很多的声控交互应用,特别是——没有出现有影响力的第三方应用。

(二)语音终端远未成型

能够大规模商用的中国版Echo还没有出现,即便非常厉害的可能也市场影响有限,养在深闺人不识吧。

(三)语音内容成本过高

1、信息获取成本过高。看文字可以一目十行,看图片可以尽收眼底,看视频基本3秒内就可以判断值不值得看下去。但是语音完全不是这样,你听一段语音(如果不是歌声),往往得听三分之一以上才能判断是否值得听,而这个过程是漫长的、听的时候还动不动走神、左耳朵进右耳朵出,如果再加上漫长的前奏简直令人抓狂。这还只是一段语音,如果我又在很多语音中来回播放暂停选择想听的内容呢?这个过程简直繁琐得崩溃了!

2、使用场景有限。一样的道理,文字图片可以在任何地方看吧,但是语音呢?

3、差异化价值“貌似”不高。既然都能看文字解决,为何要用语音呢,难道就是为了主播磁性的嗓音?如果是为了这些感性的体验,视频是不是更好一些呢?

这样看起来,好像语音一无是处,可真的是这样吗?解决几个症结就好了。

上一页12345678下一页

上一篇:LG指纹识别新技术可以让iPhone去掉Home键
下一篇:刷脸支付?机器人还没炼成“火眼金睛”
精选推荐
英国首台月球车是个小型四腿机器人 将于2021年登月
英国首台月球车是个小型四腿机器人 将于2021年登月

[2019-10-12]  探测器将用四条腿探测月球表面,并将数据传回着陆器,后者将把数据传回地球图 詹姆斯温斯皮尔英国即将成为继美国、俄罗斯、中国之后的又一 ...

南加州大学机器人学家:机器人更适合粗暴的爱
南加州大学机器人学家:机器人更适合粗暴的爱

[2019-11-07]  图片来自JOHN MADERE GETTY IMAGES打是疼骂是爱,当人类粗暴的将物体从机器人手中敲掉,看似残忍,实际上却能帮助机器人找到最好的握持物 ...

机器人iCub作为嵌入式AI的标准机器人研究平台的重要性
机器人iCub作为嵌入式AI的标准机器人研究平台的重要性

[2017-12-24]  机器人的研究在过去10年中得益于一个具有嵌入式人工智能(AI)的标准化开源平台——人形机器人iCub。iCub最初在意大利被创建,如今在欧洲、美国、韩国、新加坡和日本的实验室......

麻省理工学院最新研究:优化软体机器人的控制和设计
麻省理工学院最新研究:优化软体机器人的控制和设计

[2019-11-24]  软体机器人属于一个新的领域,它可能在诸如外科手术等领域发挥重要作用(手术时的纳米机器人需要在人体内部移动而不损伤软组织)。软体机器 ...

CES 2018:英特尔推出49量子位芯片争夺量子霸权
CES 2018:英特尔推出49量子位芯片争夺量子霸权

[2018-01-10]  在与Google、IBM的一场关于建立量子计算系统的马拉松比赛中,英特尔通过了一个关键的里程碑。近日,这个科技巨头已经推出了一个49个量子位 ...

人工智能民主化能否实现取决于科技巨头
人工智能民主化能否实现取决于科技巨头

[2017-12-29]  我们经常听到像谷歌和微软这样的公司说他们希望人工智能民主化。这是一个很好的词,民主化。 但这些公司如何界定“民主化”还不清楚,像AI本身一样,它似乎有点炒作的味道...

Waymo:人性和行为心理学才是无人驾驶最大的挑战
Waymo:人性和行为心理学才是无人驾驶最大的挑战

[2019-11-03]  自动驾驶汽车作为AI领域内最大的挑战之一,谷歌致力于其研发已有十余载,现在他们逐渐意识到,最困难的是如何让人们享受驾驶的乐趣。这是一 ...

科学家从蟑螂获得启发 教机器人更好地走路
科学家从蟑螂获得启发 教机器人更好地走路

[2017-12-11]  Weihmann指出:“我特别感到惊讶的是,动物运动稳定机制的变化与腿部协调的变化是一致的。昆虫的慢运行非常稳定,因为它的重心很低,三条腿总是以协调的方式运动。...

本周栏目热点

生物识别技术那么多,为啥偏偏“刷脸”火了

[1970-01-01]   你走到一家自助银行前,摄像头通过刷脸,自动识别你的身份为你开门;你站到ATM机前输入密码,再在摄像 ...

NEC人脸识别技术致力服务公共安全

[1970-01-01]   沸沸扬扬的哈尔滨看守所杀警越狱事件随着最后一名案犯的落网而尘埃落定,但是围绕这起案件的深度讨论却 ...

从原理入手,解析基于DSP的汉字语音识别系统的实现方式

[1970-01-01]   语音识别是机器通过识别和理解过程把语音信号转变为相应的文本文件或命令的高技术。作为专门的研究领域 ...

谷歌为何力推虹膜技术 分析其背后的价值链条-模式识别

[2015-12-11]   指纹识别、人脸识别技术正在趋于成熟,也正在被应用到更丰富的场景,逐渐改变我们生活的方方面面。但在 ...

在移动互联网上,图像识别Face++可以做什么?

[1970-01-01]   在互联网上,没人知道你是一条狗。这是1993年《纽约客》杂志关于互联网匿名性的经典论述。时光荏苒,二 ...