爱吧机器人网 » 评测 > 智能硬件评测 > 正文

智能音箱专业级评测:语音交互/声音性能/拆机分解三方面深度解析

核心提示:2017年12月4日,中国电子科技集团公司第三研究所(简称“中电三所”)联合中国电子学会消费者电子分会联合发布了,以“娱心悦耳,音智双全”为主题的智能音箱评测发布会

2017年12月4日,中国电子科技集团公司第三研究所(简称“中电三所”)联合中国电子学会消费者电子分会联合发布了,以“娱心悦耳,音智双全”为主题的智能音箱评测发布会。会上发布了目前市场关注度较为集中的五款智能音箱的评测方法与结果。
 
此次评测以中电三所下属国家广播电视产品质量监督检验中心、北京中电慧声科技有限公司、三所科技创新中心语音与智能声学实验室为技术支持,针对智能音箱交互性水平、声性能、拆机分析三大方面展开了深度评测。

\
 
智能音箱须具备扩声、语音交互、信息传输以及智能化附加功能。本次评测选择了叮咚、小米、若琪月石、问问音箱、天猫精灵等五款主流智能音箱,中电三所作为国内权威电声科研机构,组织行业专家设计评价方案、依托专业的实验设备和自身丰富的行业经验,创新评测方法,从交互性、声性能、拆机分析三维度对样品进行了评测。
 
在交互性能客观测试方面,通过主客观两个角度,分别从识别准确率、响应时间、唤醒率,以及交互体验、对话判断、执行响应、学习深度、主观感受八项评测项目对智能音箱交互性水平做出准确评价。更创建了自有语料库,兼顾关键词命令操控和网络智能检索,根据发音人性别、年龄、地域构成不同,录制了35位发生者音频,经过后期制作完成2100余条语料库命令,最终筛选出1000余条语音命令作为客观测试信号源,使评测结果更客观更科学更具参考价值。
 
智能交互性能客观分别在三种状态下进行,一种是不加任何干扰、噪声;二是只加干扰、不加噪声;三是只加噪声、不加干扰。如下是三种状态下五款智能音箱的识别准确率测试结果。

\\
 
可以看到在干扰的状态下,对音箱的语音识别率准确性影响是很大的,导致它识别率下降、变差。在测试结果中,分别给出了平均值和中位值。由于测试样本声音差异较大,导致测试结果较为离散且有极端值,甚至0%和100%的识别率出现,极端值比较大,所以用平均值代表整体趋势。离散和极端值的出现,从也反映出本次评测样本选择比较合理,没有全部选择标准普通话样本。
 
响应时间测试使用语料库中标准普通话语音命令,测试结果选取了响应时间的最大值而非选平均值,因为考虑到响应时间越长用户使用体验越差。从测试结果上看,在网络流畅的状态下,不同的测试环境对响应时间的影响并不明显,这与各个音箱介入软件的平台完全语音语义理解部分功能有关。

\
 
唤醒率与智能音箱硬件麦克风阵列、软件算法关系密切。在2.5米处净信道、干扰状态、噪声状态下唤醒率均为100%,4米处唤醒率下降。通过拉距测试得知,距离影响唤醒的成功率,并且在唤醒之后的语音识别率更低。例如:用户说“天猫精灵”,它回答,用户再问它问题,它可能就无法正确回答。鉴于目前的情况下,我们要真的实现“动口不动手”,还是要离音箱更近一点,声音再大一点。

\
 
交互性主观评价采用单刺激连续质量评价方法(SSCQE方法), 评价交互体验、主观感受、对话判断、学习深度、执行响应等五项评价指标,五项加权后标准偏差为S,经测试五款音箱标准偏差分别为:S叮咚=0.79, S问问=0.45, S若琪=0.34,S天猫=0.36, S小爱=0.57。

\
 
智能交互性能评测结论显示,多声源干扰对于智能音箱语音识别能力影响很大,如何甄别确实需要科学算法解决,且掩蔽效应如何合理设计优化算法,是智能音箱R&D正在努力的方向。当前各智能音箱支持的智能搜索类语音命令库范围还需要极大升级,很多命令都是回复,“不知道”或者“目前无此功能”。这直接导致用户的厌烦情绪,间接影响了智能音箱发展前景。智能音箱的联网优化需要进一步提高。
 
声性能测试方面,一个完美的音箱,应该在各个频段都具备饱满、平坦的特点,有些更注重饱满,有些更注重平坦。依据GB/T 12060.5-2011《声系统设备 第5部分:扬声器主要性能测试方法》标准,在尖劈全消音室对音箱进行客观频响测试、失真测试、最大声压级测试。

\\
 
以上是五款音箱的响应曲线与失真曲线。小米音箱人耳可闻的失真,最大声压级是70dB,可以保证播放语音类信号的时候声音洪亮,高频的时候有明显下降,会造成小米音箱播放中高频如琵琶,会声音发闷,不具备声音明亮感;若琪音箱有效频段可以有效覆盖中高频段,但低频失真过大;叮咚智能音箱采用四个全频单元,失真在较小范围内,在辅助单元的帮助下最大声压级可以达到76dB,无法完美展示含有中高频段的音乐;问问保证了有效覆盖中高频,失真控制在较小范围内,较高频段存在较大失真,造成听取较高频段的声音时候出现刺耳音;天猫从中频段开始有下降,全频段都有较大失真,最大声压级只有66dB,这款音箱在工艺设计上对音质有较大的损失。

\
 
通过以上数据统计,五款音箱有效频带都在100Hz以下,均可完美地表现语音交互效果,但市面上的智能音箱音质还与传统音箱有较大的差距。
 
依据GB/T 12060.13-2011《声系统设备 第13部分:扬声器听音试验》、GB/T 15000 《标准样品工作导则》、GB/T 10240-88《电声产品声音质量主观评价用节目源编辑制作规范》邀请业内专家与受训普通听众共同对音箱进行低频力度、中频平坦度、高频饱满度、保真度、拟合度五项测试进行主观评价。通过拟人声和音乐欣赏两方面,判断语音清晰及洪亮程度,以及音质优劣。
 
在拆机分析方面,将基本硬件平台拆分为五个模块,分别是麦克风阵列、主控芯片DSP、扩声单元、数字功放、通信模块。对五款产品每个模块的材料选用进行了横向对比,展现了科研机构的专业性和严谨性。
 
1. 麦克风阵列,主要目的是拾取语音,加载数字音频处理算法可以实现降噪、回声抑制、去混响、声源定位,解决远场拾音问题,与远讲语音识别算法相匹配。
 
(1)小米AI麦克风阵列,六全向硅麦克风,I2S接口数字硅麦。
\
 
(2)天猫精灵麦克风阵列,六全向硅麦克风,TI ADC3101接口。
\
 
(3)叮咚麦克风阵列,7+1麦克风阵列,科胜讯CX20810-11Z接口。
\
 
(4)出门问问麦克风阵列,双麦克风,科胜讯CX20921接口。
\
 
(5)月石智能语音机器人麦克风阵列,六全向硅麦克风。
\
 
2.主控芯片,完成的功能是对语音语义的解析理解。与手机等移动设备相类似,包括处理器、存储器、内存等核心部件。主控单元主要完成前端语音信号的整合以及后端语音拾取进行整合。主控单元的选择需要在满足语音交互响应速度的前提下,尽量压缩成本和功耗。
 
被测的五款样品主控单元如下表:

\
 
3.扩声单元,提供用户认可的音质。智能音箱扩声部分设计有一定的限制,在发声单元的选择上,受到音箱尺寸限制,低音不足,辅助低音被动辐射器。另外,全双工的工作要求限制了音箱的最大音量,发声单元功率太大会影响音箱拾取用于语音的灵敏度。五款音箱扩声单元选用如下:
 
(1)小米AI
\
小米的主扩使用的是2.25寸全频扬声器,从低频一直到高频。配套了两个对称的32平方厘米的辅助低音被动辐射器。国内外知名音箱产品多数带有导向管,用导向管来补偿低音。但是导向管补偿低音的时候会带来风噪,无论前置还是后置都有风噪进入到音箱,就影响到低频带来噪声。而小米是采用45度的导向锥,改变了中高频的传播方向。
 
(2)天猫精灵
\
 
天猫精灵使用全频扬声器,带了两个对称的辅助低音被动辐射器组成。
 
(3)叮咚
\
叮咚智能音箱是4个1.5寸的全频带单元的,主扩。3寸1个低音单元,里面采用U形的导向管,同时在喇叭前面加了一个导音锥。
 
(4)出门问问
\
 
出门问问是1寸高音单元,有50W大功率,3寸低音单元,两侧配有两片被动辐射器,共振增强低音效果。
 
(5)月石智能语音机器人
 
月石智能音箱,两个6欧的3W的扬声器,也配备了两个波动辐射器。
\
 
4.数字功放模块,扬声器需要好的功放来支撑将我们播放的音频尽可能真实、低失真的传导到发声单元上。
 
功放单元五款产品中基本四款都是选用的TI公司的功放芯片,四款功放芯片不尽相同,其中有两种接口,小米选用的功放芯片具有I2S接口,即数字的音频接口,不需要经过第二次转换,并且该功能芯片支持多种速率,可以使用软件接口进行部分控制;天猫精灵的功放芯片略为简单;月石智能音箱功放芯片是一个模拟信号输入,搭载了TI公司的主控芯片。
\
 
5.通讯模块是连接语音开放平台,获取内容资源,使用WIFI/蓝牙技术连接,提升手机的音质,让音乐得到分享。厂家可以通过丰富内容资源,增加用户粘性。
\
 
此次评测结果显示,五款智能音箱在交互性能与音质综合评分上都略有不足。同时也证明了并非越贵的产品性能越好。优秀的智能音箱产品应该兼顾智能与音质双方面,但目前行业浮躁的气氛使得制造商忽略了产品品质与使用体验。希望通过此次评测能够改变行业风向,同时告诉消费者好的智能音箱的标准,了解智能音箱优劣。
 
此前,中电三所泰瑞特研究曾对10款头戴式耳机进行评测并成立音质评价实验室,后续还将针对降噪耳机等不同类型电声产品持续开展系列评测活动,致力于利用专业评测结果向消费者推荐优秀的电声产品,践行品质为先的理念,不断推动行业产品革新和技术进步。


分享到

上一篇:百度raven H之AI音箱初体验 除了贵哪都好
下一篇:荣耀V10深度评测:双摄AI,全面屏也有前置指纹

你看到此篇文章的感受是:

本周栏目热点

易康就医智能针灸血压训练仪评测

[2018-04-15]  写在前面:在没有结婚以前,在我父母眼里,我一直都是个孩子,结婚以后,有了自己的家,回家的时候也从一年回去N次变成了一年只回去两次, ...

小米VR眼镜正式版评测:不看品牌值多少钱?

[2018-04-21]  为年轻人,很容易接受新鲜事物。小米推出的VR产品——小米VR眼镜,作为小米VR玩具版的升级,确实给我全新的感觉。小米VR正式版,不管从外观 ...

智能硬件Sleepace舒派智能睡眠监测器评测

[2018-04-15]  文 网易酷品达人 姜经露未来世界网科技资讯一天忙碌的生活过去了,到了夜晚,我们需要八小时的睡眠来让我们的身体休息休息,睡眠的质量好 ...

超未来科技感的VR设备,HUAWEI VR 2外观设计图赏评测

[2018-04-24]  在今年的华为年度旗舰新品的发布会上,华为为我们带来了全新的Mate系列手机,和支持eSIM的HUAWEI Watch 2 Pro手表,以及最新推出的HUAWEI VR 2设备。...

小米米家扫地机器人深度体验:骗子还是神器?

[2018-04-24]   一、简单开箱  ▼打开来里面还有一个纸箱,这这才是满满小米风格的外包装,一面印上了小米与米家的LOGO,另一面为产品线条图。  ▼整 ...

精选推荐

揭秘达芬奇手术机器人
揭秘达芬奇手术机器人

[2018-04-19]  达芬奇手术系统是由美国Intuitive Surgical公司制造的机器人手术系统。美国食品和药物管理局(FDA)于2000年通过该标准,旨在利用微创手段 ...

通过对抗性图像黑入大脑
通过对抗性图像黑入大脑

[2018-03-02]  在上面的图片中,左边是一张猫的照片。在右边,你能分辨出它是同一只猫的图片,还是一张看起来相似的狗的图片?这两张图片之间的区别在于, ...

德国研发出一种能在你体内工作的微型机器人

[1970-01-01]  纽约时报的报道,德国的研究人员已经开发出一种长约七分之一英寸的机器人,首先看起来不过是一小块橡皮条。然后它开始移动。机器人走路,跳跃,爬行,滚动和游泳。它甚至爬出......

机器人灵巧手将成为智能机器人的下一个重大突破
机器人灵巧手将成为智能机器人的下一个重大突破

[2018-01-25]  计算机科学教授兼东北地区助手机器人实验室负责人罗伯特·普拉特(Robert Platt)说:“机器人手操作是下一步要解决的问题。想象一下,一个机器人可以在现实世界中用手去做事......

CES 2018:英特尔推出49量子位芯片争夺量子霸权
CES 2018:英特尔推出49量子位芯片争夺量子霸权

[2018-01-10]  在与Google、IBM的一场关于建立量子计算系统的马拉松比赛中,英特尔通过了一个关键的里程碑。近日,这个科技巨头已经推出了一个49个量子位 ...

从AI中窥探人性
从AI中窥探人性

[2018-01-03]  人们对人造智能的恐惧早已成为科幻书籍和电影的极好题材。但现在,一些同样的担忧开始影响关于现实世界AI技术的政策讨论。如果这样的担忧演变成为一种技术恐慌...

2017年:AI渗入云端
2017年:AI渗入云端

[2017-12-29]  云中的人工智能不仅仅是科技巨头的权力游戏,它也可能是人工智能领域的下一个飞跃。加利福尼亚州的Rigetti Computing公司刚刚使用其原型量子芯片之一在其云平台上运行机器学......

人工智能民主化能否实现取决于科技巨头
人工智能民主化能否实现取决于科技巨头

[2017-12-29]  我们经常听到像谷歌和微软这样的公司说他们希望人工智能民主化。这是一个很好的词,民主化。 但这些公司如何界定“民主化”还不清楚,像AI本身一样,它似乎有点炒作的味道...

美国Natilus公司试飞水上无人货机 设计简单成本降低
美国Natilus公司试飞水上无人货机 设计简单成本降低

[2017-12-28]  Natilus创业公司成立于2014年,其梦想是建造大型无人机,以半价提供比船舶快得多国际货运。在十二月份,Natilus计划在旧金山湾测试一个9米翼展的小型原型无人机的水上滑行能力......

助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出
助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出

[2017-12-25]  本文提出了一个大型的、长序列的、用于行人重识别的视频数据集,简称LVreID。与现有的同类数据集相比,该数据集具有以下特点:1)长序列:平均每段视频序列长为200帧,包含丰......