首页> 中文学位 >一种面向NAO机器人的语音识别系统研究
【6h】

一种面向NAO机器人的语音识别系统研究

代理获取

目录

声明

摘要

第一章 绪论

1.1 课题研究背景和意义

1.2 语音识别发展现状

1.2.1 国外语音技术发展概况

1.2.2 国内研究历史及现状

1.3 机器人发展简介

1.4 机器人语音识别面临的技术难点

1.5 本文主要的研究内容

1.6 本文的结构安排

第二章 语音识别的基本原理与技术分析

2.1 语音识别基本原理

2.2 语音识别的分类

2.3 语音信号预处理

2.3.1 语音采样与量化

2.3.2 预加重与归一化

2.3.3 分帧加窗

2.4 语音信号的端点检测

2.4.1 短时能量和短时平均幅度

2.4.2 短时平均过零率

2.4.3 双门限法原理及其改进

2.5 语音信号的特征提取

2.5.1 线性预测系数

2.5.2 线性预测倒谱系数

2.5.3 Mel频率倒谱系数

2.6 本章小结

第三章 语音识别算法

3.1.1 动态时间规整

3.1.2 隐马尔可夫模型

3.1.3 人工神经网络

3.1.4 上述方法的优缺点

3.2 基于DTW的语音识别算法

3.2.1 DTW基本原理

3.2.2 模板匹配的训练方法

3.3 DTW算法改进

3.3.1 整体路径约束

3.3.2 搜索宽度限制

3.4 DTW实验结果及分析

3.4.1 整体路径约束DTW算法实验

3.4.2 搜索宽度限制DTW算法实验

3.4.3 针对不同特征提取参数(LPCC、MFCC)的DTW算法实验

3.5 基于HMM模型的语音识别算法

3.5.2 HMM定义

3.5.3 HMM模型结构

3.5.4 HMM模型的分类

3.6 HMM模型的三个基本问题

3.6.1 前向-后向算法——第一个问题的求解

3.6.2 Viterbi算法——第二个问题的求解

3.6.3 Baum-Welch算法——第三个问题的求解

3.7 求解HMM时应该注意的问题

3.8 HMM算法实验仿真结果及分析

3.9 本章小结

第四章 NAO机器人语音识别系统联合实验平台的搭建

4.1 硬软件平台

4.1.1 NAO机器人简介

4.1.2 NAO机器人—般特征

4.1.3 官方软件平台Choregraphe介绍

4.2 联合实验平台的搭建过程

4.2.1 语音的捕获

4.2.2 语音的转移

4.2.3 模型的训练

4.3 语音的识别与传输

4.3.1 服务器端的建立

4.3.2 客户端的建立

4.3.3 客户端和服务端通信的建立

4.4 本章小结

第五章 总结与展望

5.1 总结

5.2 展望

致谢

参考文献

攻读学位期间的研究成果

展开▼

摘要

研究和实现机器人的智能化,对提高人类生活品质有十分重要的意义。而研究机器人语音识别系统,实现人机自由交互是智能机器人提供智能服务的前提。NAO机器人作为全球科研应用最广泛的机器人之一,对NAO机器人进行相关的语音识别系统的研究具有重要的意义和价值。本文为实现人与NAO机器人之间的智能交互,设计了一种面向NAO机器人的语音识别系统的联合实验平台。
  首先,对语音识别的发展历程和研究现状进行了分析,研究了语音识别技术的基本原理和信号处理技术,研究了短时能量、短时过零率、双门限法三种端点检测方法,并对双门限法原理进行了深入分析;对语音信号的三种特征提取技术包括线性预测系数(LPC)、线性预测倒谱系数(LPCC)和Mel频谱倒谱系数(MFCC)进行了深入的分析和研究,并对线性预测倒谱系数和Mel频谱倒谱系数两种特征提取方法进行了特征参数对比实验,通过对比表明基于Mel频谱倒谱系数的特征提取方法具有更高的匹配度。
  其次,在对语音识别的模型和算法进行了总结归纳的基础上,研究了动态时间规整(DTW)算法和隐马尔可夫(HMM)模型两种语音识别模型算法;分析了DTW算法的基本原理,研究了基于整体路径约束和搜索宽度限制的DTW算法实验的改进,通过对比算法改进前后识别率验证了两种改进算法的有效性;同时分别采用基于LPCC和MFCC两种特征提取方法的DTW算法的对比实验,表明基于Mel频谱倒谱系数的DTW算法具有较高的识别率,这说明Mel频谱倒谱系数在一定程度上更能反映语音信号的特征。对HMM模型的三个问题及其解法进行了深入研究,并对求解HMM模型时常见问题如初始值的选择、训练数据不足、数据溢出问题、多观察矢量序列训练进行了剖析;建立了HMM模型的语音识别系统,通过实验确定了HMM模型的最佳状态数值、信噪比越高系统识别效果越好以及HMM模型对连续词的识别效果比DTW算法更优的结论。
  最后,搭建了基于HMM模型的NAO机器人语音识别系统的联合实验平台。系统阐述了联合实验平台对音频的捕获和处理操作、转移、机器训练和识别等过程;通过建立了传输控制协议(TCP/IP协议),完成了对作为服务端的NAO机器人和客户端的MATLAB之间的通信。实现了服务端对音频的捕获、客户端对语音信息的处理识别以及通过协议将识别结果传输到服务端控制软件Choregraphe中,由控制软件根据识别的结果触发特定行为指令的过程。该联合实验平台结构简单,易于扩展和移植,具有较好的识别性能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号