爱吧机器人网 » 技术 > 模式识别 > 正文

语音识别领域的GitHub:Wit.ai让每个公司拥有自己的“Siri”

即便对苹果和Google这样的公司来说, 语音识别 也很难,两家公司都收集了大量实时语音数据,帮助开发Siri和Google Now的 算法 ,但效果不尽如人意。对小公司来说,打造 语音识别 应用就更加困难了,而且它们往往无法收集到大量的真实语音数据。而这就是Alexandre Lebrun的工作。

他创办的Wit.ai能将开发者的语音样本集合起来,帮助开发语音及 自然语言 识别系统,Lebrun认为他们的成果在尝试和广度上能与苹果和Google一较高下。这一平台也反映了一种趋势,即随着无屏幕的可穿戴设备的兴趣,越来越多的开发者会使用语音交互技术。

目前,Wit.ai已经吸引了数千开发者,而本周三它在种子轮中融资了300万美元。

发现问题

事实上,Wit.ai脱胎于Lebrun之前创立的公司VirtuOz,该公司专为AT&T等公司开发 语音识别 系统。但在工作中,Lebrun发现每开发一个新系统,一切都要重新开始。对每一个项目,他们都要收集新的语音样本以训练系统。虽然各项目的语音指令集有重叠的部分,但VirtuOz无法将一位客户的样本用于另一位客户项目。

结果是, 语音识别 效果并不完美,在体验上也十分糟糕。更重要的是,由于 语音识别 系统的设置费用相当高,服务商都不会解决小公司或开发者的需求。

去年,Lebrun将VirtuOz卖给了开发出Siri的 语音识别 公司Nuance,然后创立了Wit.ai。

如何运作?

一般而言, 语音识别 系统的开发会从“语法”(想要计算机识别的语句的集合)开始,然后开发者会使用尽可能多的语句发音样本“训练”计算机,让其识别语法。由于用户指令各异,同一需求有多种表达方式,所以语法要尽可能多。

Wit.ai所做的是让公司共享语法和训练数据,就像GitHub让软件开发者共享代码一样。开发者能对GitHub上的代码进行更改,而Wit.ai上的语法也能用于开发不同的应用。

Wit.ai的商业模式也与GitHub相同,用户会免费分享数据。不过为了保护隐私,用于训练系统的音频记录不能共享,而不愿共享语法或数据的公司可以付费使用该公司服务。

免费

与Wit.ai一样,现在有越来越多的公司和项目能帮助开发者在各自的应用上布署 语音识别 系统,其中有开源项目Julius和CMU Sphinx,也有Google的语音转文本服务。Lebrun希望通过免费获取更多的语法和训练数据,最终根据这些数据开发的系统能与苹果及Google匹敌。

Wit.ai的一个问题是,所有音频都要通过 互联网 传输到公司的服务器,这意味着使用时会出现延时,甚至隐私问题。不过,Lebrun表现,现在已经有了一个混合版本,能直接在客户端工作。


上一篇:基于Julius的机器人语音识别系统构建
下一篇:安全支付从指间开始 人脸识别尚待改进
精选推荐
农业将为高科技行业 农业机器人的应用领域
农业将为高科技行业 农业机器人的应用领域

[2017-12-17]  农业正在迅速成为一个令人兴奋的高科技产业,吸引了新专业人士,新公司和新投资者。技术发展迅速,不仅提高了农民的生产能力,而且促进了我们所知道的机器人和自动化技术的发展。...

助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出
助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出

[2017-12-25]  本文提出了一个大型的、长序列的、用于行人重识别的视频数据集,简称LVreID。与现有的同类数据集相比,该数据集具有以下特点:1)长序列:平均每段视频序列长为200帧,包含丰......

MIT研制出可以像植物一样生长的机器人
MIT研制出可以像植物一样生长的机器人

[2019-11-09]  麻省理工学院开发了一种新型机器人,这种机器人可以本质上自我延伸,其生长方式与植物幼苗向上生长的方式惊人相似。值得注意的是,研究人员 ...

17世纪的莱布尼茨试图制造“思想机器”却被现实打脸
17世纪的莱布尼茨试图制造“思想机器”却被现实打脸

[2019-11-05]  莱布尼茨,德国哲学家、数学家、律师,历史上少见的通才1666年,德国博学家戈特弗里德·威廉·莱布尼茨(Gottfried Wilhelm Leibniz)发 ...

机器人工程师具体都做什么?
机器人工程师具体都做什么?

[2017-12-08]  机器人工程师是幕后设计师,负责创建机器人和机器人系统,能够执行人类无法完成或不愿意完成的任务。 通过他们的创造,机器人工程师帮助工作更安全,更轻松,更高效,特别是......

Crossbar将电阻式RAM推入嵌入式AI
Crossbar将电阻式RAM推入嵌入式AI

[2018-05-17]  电阻RAM技术开发商Crossbar表示,它已与航空航天芯片制造商Microsemi达成协议,允许后者在未来的芯片中嵌入Crossbar的非易失性存储器。此举是在先进制造业节点的领先代工厂选......

2023年服务机器人市场将超过250亿美元
2023年服务机器人市场将超过250亿美元

[2017-09-04]  全球服务机器人市场预计到2023年将达到250亿美元, 并在预测期内登记15% 的复合年增长率。短期中期回收期和投资回报率高 (ROI), 以及在教育和研究、临场感、防御、救援和安......

7种常见的机器人焊接类型
7种常见的机器人焊接类型

[2017-12-17]  机器人焊接是工业领域最常见的机器人应用之一,近几十年来主要由汽车行业驱动。机器人焊接在完成大批量,重复性的焊接任务时效率最高。...

本周栏目热点

苹果公司收购Regaind人工智能初创公司

[2017-10-01]  要说新一代的iPhone有什么新的黑科技,那么就一定要说到配备在iPhone X身上的人脸识别技术了,可以说,这是目前iPhone的最新也是最为惹人 ...

Facebook信使测试语音转换文字功能

[1970-01-01]   Facebook正在测试一项新的功能,该功能是Facebook信使应用的部分功能,它可以自动将语音信息转换为文字 ...

人脸识别:离生活越来越近

[1970-01-01]   你来到家门口,不用再在包里翻来翻去找钥匙,对着门前的 人脸识别 系统刷脸确认身份,便可进门;在超市 ...

人机交互技术:2015指纹识别将大爆发

[1970-01-01]   各项关于人机交互的技术正在不断发展、日益成熟,明年 指纹识别 技术将得到大爆发。所谓指纹辨识,顾名思 ...

科大讯飞第一季营收1.7亿 中移动成单一大股东

[1970-01-01]   4月24日消息,科大讯飞(股票代码:002230)昨日发布公告,公告显示,科大讯飞2013年第一季度营收1 73 ...