首页> 中文学位 >基于语音识别的服务机器人口语对话系统研究
【6h】

基于语音识别的服务机器人口语对话系统研究

代理获取

目录

第一章 绪论

1.1课题研究背景及意义

1.2国内外发展历史及研究现状

1.3本文的主要内容及安排

1.4本章小结

第二章 语音信号理论基础

2.1 语音信号的产生与模型

2.2 语音信号的预处理

2.3 语音信号的特征参数提取

2.4本章小结

第三章 语音识别模型训练

3.1 语音识别概述

3.2 语言模型

3.3 声学模型

3.4 本章小结

第四章 鲁棒性语音特征参数提取和处理

4.1 噪声对语音信号的影响

4.2 鲁棒性语音识别技术

4.3 基于Gammatone滤波器的特征提取

4.4 直方图均衡化法

4.5 本章小结

第五章 服务机器人口语对话系统设计与实现

5.1 系统总体设计

5.2 硬件具体设计方案

5.3 软件总体设计方案

5.4 本章小结

第六章 实验结果与分析

6.1 鲁棒性语音特征参数提取实验

6.2 基于语音识别的服务机器人对话系统实验分析

6.3本章小结

总结与展望

1.本文研究工作总结

2.未来展望

参考文献

攻读学位期间发表的论文

声明

致谢

展开▼

摘要

随着自动化技术以及计算机科学技术的快速发展,机器人的类型和功能变得愈加丰富、完善,越来越多的机器人开始进入人们的视野并参与到人类的生活当中。然而,随着人们生活水平的日益提高,传统的按键、鼠标、键盘等人机交互方式已经很难满足人们的需求,人们开始迫切寻求一种更加便捷、更加人性化的人机交互方式。语音识别技术作为模式识别中一个极其重要的分支,目的就是为了让机器人“听懂”人类的自然语音,为这种交互方式开辟新的方向。然而,噪声的存在不但严重影响语音识别系统的性能,而且极大限制了其应用范围,因此系统的鲁棒性直接决定其能否成功迈出实验室而走向商业市场。本文在分析比较多种抗噪声干扰语音识别技术后,提出一种语音信号特征参数提取和特征参数处理相结合的方式提高语音识别系统的鲁棒性,并将其成功应用到噪声环境下服务机器人的口语对话系统中。
  首先,本文介绍了语音信号的基础理论知识,从语音信号的产生与模型建立到语音信号的A/D转换、预加重、分帧和加窗以及端点检测等预处理,再到语音信号的特征参数提取,其中详细介绍了语音信号的线性预测系数(LPL)、线性预测倒谱系数(LPCC)以及Mel频率倒谱系数(MFCC)。
  其次,本文介绍了语音识别技术的训练模型,从该技术的语言模型和声学模型入手,着重研究和分析了声学模型中实际应用最多的隐马尔科夫模型(HMM),并对其数学原理进行了详细推导。
  然后,针对语音识别系统中实际面临的,由于噪声干扰导致语音识别过程中测试环境和训练环境不匹配而影响系统识别性能的问题,本文在深入研究多种不同的鲁棒语音识别算法后提出将基于Gammatone滤波器的特征参数提取方法和直方图均衡化法相结合的方式提高语音识别系统的抗噪声干扰能力,增强系统的鲁棒性。并将基于本文方法提取的语音信号特征参数与传统的Mel频率倒谱系数进行Matlab仿真实验比较,实验结果表明本文提出的特征参数提取方法抗噪性能更佳,在噪声环境下的语音识别正确率更高。
  最后,本文介绍了基于语音识别的服务机器人口语对话系统的构建方法,深入研究了该系统中音频采集模块、语音识别模块、中文处理模块、本地知识库匹配模块以及语音合成模块的工作原理和实现方法。并将本文提出的鲁棒性语音识别算法应用到该系统的语音识别模块中,成功开发出一款以服务机器人为平台基于语音识别的口语对话系统。经过测试,该系统在噪声环境下的语音对话效果良好。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号