基于Julius的机器人语音识别系统构建-模式识别-技术-爱吧机器人网

基于Julius的机器人语音识别系统构建

2015-12-08 爱吧机器人网浏览量：

(4)HMM训练

本系统先使用HInit工具对HMM模型进行初始化，再用HCompv工具来对模型进行平坦初始化。HMM模型的每个状态给定相同的平均向量和变化向量，在整个训练集上全局计算而得。最后用HRest的多次估计迭代，估计出HMM模型参数的最佳值，经多次迭代，将训练得到的单个HMM模型整合到一个hmmsdef．mmf文件中。声学模型HTK训练流程如图5所示。

3．2 Julius应用

3．2．1 Julius部署

在本系统中语音识别部分是部署在Atom Z510上，而Atom Z510上首先需要移植linux操作系统(本系统采用的是ubuntu8．10)以上步骤在此不详细介绍，文献中有详细说明。语音识别的核心部分是Julius识别器，需要将Julius源码编译部署到Atom Z510平台。其步骤如下：

①要确保linux系统中有以下支持库：Zlib、flex、OSS音频驱动接口、ESounD和libsndfile。

②从Julius官网下载源代码Julius-4．1．5。

③解压：tar-zxjf julius-4．1．5。

④编译：％．／configure，％make，％make install。

3．2．2 Julius配置

Julius全部采用C语言代码实现，采用模块化设计方式，而且各功能模块可配置。在使用前需要将配置参数写入jconf文件，此文件作为运行参数载入系统，系统扫描参数配置并启动各功能块。其中重点介绍以下几个配置参数：

◆-dfa rtdog．dfa，指定语法文件rtdog．dfa；

◆-v rtdog．dict，指定字典文件；

◆-h rtdog．binhmm，指定HMM模型文件；

◆-lv 8000，设定音频的阈值便于滤去噪音；

◆-rejectshort 600，设定最小的语音长度；

◆-input mic，设定语音的输入方式为microphone。

3．3 语音识别系统软件设计

3．3．1 GUI设计

本系统为了方便测试，采用QT4的图形库来开发人机界面(GUI)，同时加入了手动控制的按钮。其总体功能如图6所示。通信线程是本系统的数据传输枢纽，十分重要。在QT中通过对线程类QThread继承来实现新的线程设计。该类提供了创建一个新线程以及控制线程运行的各种方法。线程是通过QThread：：run()重载函数开始执行的。在本系统中设计了1个数据通信线程，用它来不断地读取共享内存中的语音命令，然后将其转化为控制命令传给机器人控制模块。

3．3．2 模块间通信

由于系统的3个模块不在同一个平台上部署，运行过程中需要进行数据通信。GUI和Julius都部署在Atom Z510平台上，但属于2个进程，它们之间可以通过共享内存来交互数据。而GUI和机器人控制模块就需要通过网络通信来实现数据交互。这里采用的是基于TCP的socket编程接口来实现模块间的通信，模块间通信流程如图7所示。

4 实验测试

演示系统界面如图8所示。本文使用大量的语音样本来完成HTK的训练和模式构建，语音样本采用16 kHz采样，16位量化。独立的语音识别测试中，将训练集以及测试集中语音样本和识别结果进行了对比分析。本文语音样本的内容包括训练集(语料库中的语音成分)和测试集(本实验中采集的语音)。由于本系统只用提取语音命令，不需要完整句子的识别，所以没有针对句子做测试。

本文对于训练集基于词的识别率为71．7％，测试集基于词的识别率为56．5％，测试结果如表1所列。

表中各符号所表示的意义如下所示：

H，正确；S，替代错误；D，删除错误；I，插入错误；N，标记文件中单元总数；SENT，句子，WORD：基本单元。

结语

本文在给定的实验室机器人平台上，设计了基于语音控制的机器狗系统。其中，语音识别子系统通过HTK和Julius的开源平台构建而成。经过测试分析，该系统能够较好地识别人发出的语音命令，简化了机器人的操作，使机器与人的交互更加智能化。

精选推荐

2022年全球工业机器人市场将达到790亿美元

[2017-09-04] 预计到 2022年, 全球工业机器人市场将达到790亿美元, 并在预测期内登记11 5% 的复合年增长率。随着发展中国家中小型企业需求的不断增长, 采用自动化技术以确保生产质量......

助力卷积神经网络时空特征学习史上最大行人重识别视频数据集被提出

[2017-12-25] 本文提出了一个大型的、长序列的、用于行人重识别的视频数据集，简称LVreID。与现有的同类数据集相比，该数据集具有以下特点：1）长序列：平均每段视频序列长为200帧，包含丰......

谷歌在中国成立一个新的人工智能（AI）研究中心

[2017-12-13] 谷歌正在中国建立一个新的人工智能（AI）研究中心，希望进一步扩展到中国，以充分利用中国高度重视的人工智能技术。人工智能是目前地球上最具竞争力的领域之一，亚马逊，微软......

机器人工程师具体都做什么？

[2017-12-08] 机器人工程师是幕后设计师，负责创建机器人和机器人系统，能够执行人类无法完成或不愿意完成的任务。通过他们的创造，机器人工程师帮助工作更安全，更轻松，更高效，特别是......

九台“猎豹”机器人组队踢球，麻省理工高材生们的高级趣味

[2019-11-09] 本周，在麻省理工学院10号楼外草坪上展开了一场别开生面的足球比赛。在绿草如茵的基利安球场上，一群由人工智能驱动的机器人就是这场比赛的 ...

担心机器换人？自1950年以来只有一个职业被机器彻底取代

[2017-03-21] 虽然有很多关于机器人取代工人的担心，但哈佛经济学家James Bessen的论文指出，在过去的67年里机器人仅仅淘汰掉人类工作中的一个。在1950 ...

一个让深度学习惨败的通用人工智能领域——语境处理

[2019-11-04] Context是指用来解释一段给定文本或语句的来源框架，我们可以翻译为上下文或语境。维基百科将context定义为：*在符号学、语言学、社会学和 ...

英国首台月球车是个小型四腿机器人将于2021年登月

[2019-10-12] 探测器将用四条腿探测月球表面，并将数据传回着陆器，后者将把数据传回地球图詹姆斯温斯皮尔英国即将成为继美国、俄罗斯、中国之后的又一 ...

本站内容除了特别注明本站原创以外均来自互联网，文章观点不代表本站立场，文章版权归属原作者；如涉及版权问题，请联系[email protected]，我们会立即处理。谢谢配合！

本周栏目热点

在移动互联网上，图像识别Face++可以做什么?

[1970-01-01] 在互联网上，没人知道你是一条狗。这是1993年《纽约客》杂志关于互联网匿名性的经典论述。时光荏苒，二 ...

除了智能手机指纹识别技术还可以用在哪？

[2016-05-07] 4月15日消息，据路透社报道，指纹识别技术可能不久之后就能够用于智能手机以外的地方，如识别用信用卡支付的购物者和地铁通勤者， ...

谷歌语音识别想超过人类，方法是借助神经网络

[1970-01-01] 导语：彭博社今天撰文称，谷歌正在语音识别领域展开野心勃勃的尝试，希望通过技术手段实现超越人类的语 ...

人脸识别未来发展将突破安防应用范畴

[1970-01-01] 生物特征识别技术是目前最为方便、安全的身份识别技术，它辨识的是人身的固有特征，不需要身外的其他标 ...

生物特征识别技术实现原理与前景分析

[1970-01-01] 指纹识别技术前言与传统的身份鉴别方法相比，生物特征识别技术更加安全、保密。这是因为生物特征在某种 ...