首页> 中文学位 >护理床翻身动作的语音控制研究
【6h】

护理床翻身动作的语音控制研究

代理获取

目录

摘要

第一章 绪论

1.1 研究目的和意义

1.2 国内外研究现状

1.2.1 护理床翻身动作语音控制研究现状

1.2.2 语音识别研究现状

1.2.3 语音信号端点检测现状

1.2.4 语音信号特征降维现状

1.3 主要研究内容及特色

1.4 本章小结

第二章 语音信号预处理与特征提取

2.1 语音信号的预处理

2.1.1 语音信号预加重

2.1.2 语音信号端点检测

2.1.3 聚类算法

2.1.4 基于模糊聚类算法的端点检测门限估计方法

2.2 语音信号特征参数提取方法

2.2.1 语音信号特征参数

2.2.2 梅尔频率倒谱系数(MFCC)特征参数提取方法

2.3 本章小结

第三章 语音识别算法的研究

3.1 语音识别简述

3.2 动态时间规整(DTW)语音识别算法

3.3 隐马尔科夫模型(HMM)语音识别算法

3.3.1 HMM简介

3.3.2 HMM输出概率的计算

3.3.3 HMM的参数训练算法

3.3.4 HMM识别算法

3.4 DTW算法与HMM算法的比较

3.5 本章小结

第四章 基于主成分分析的语音信号特征降维算法研究

4.1 主成分分析(PCA)简介

4.2 主成分计算

4.2.1 第一主成分计算

4.2.2 第k个主成分计算

4.2.3 样本的主成分与主成分选取

4.2.4 主成分分析的性质

4.3 语音信号特征的降维

4.4 本章小结

第五章 护理床翻身动作语音控制系统的设计与实现

5.1 系统总体结构组成

5.2 系统的硬件实现平台

5.3 系统软件设计

5.3.1 系统的软件开发环境

5.3.2 系统的控制界面设计

5.4 语音识别程序设计

5.5 本章小结

第六章 实验结果分析

6.1 语音信号端点检测实验

6.2 基于PCA降维的HMM语音识别实验

6.3 护理床翻身动作控制系统调试实验

6.4 本章小结

结论及展望

参考文献

攻读学位期间发表论文

声明

致谢

展开▼

摘要

通过语音识别实现装置的控制是近年来的研究热点,具有广泛的应用前景。语音识别使得计算机能以方便、自然、快捷的方式听懂人类的语言,尽管目前语音识别技术已取得了巨大的进展,但是在识别率、实时性等方面仍然存在较大不足。
   护理床翻身动作的语音控制模式采用语音识别技术实现护理床翻身动作的语音控制。本文在分析语音识别过程的基础上,深入研究了基于模糊聚类算法的语音信号端点检测门限阈值的自动获取方法,并通过主成分分析法(Principal Component Analysis,PCA)对语音信号的特征数据集进行降维,从而使得在采用隐马尔科夫模型(Hidden Markov Model,HMM)算法进行语音识别过程中的训练时间大幅度缩短。本项目得到广东省科技计划项目“低成本的多功能护理及生理参数远程监护装置”(项目编号:2010A030500006)和佛山市科技计划项目“多功能护理机器人”(项目编号:FZ2010013)的资助。
   首先,本文介绍了研究内容的相关背景知识和研究意义;分析了护理床翻身动作控制的研究现状、语音识别研究现状、语音信号端点检测现状和语音信号特征降维的现状。
   其次,本文对语音信号的特征数据进行预处理,主要包括语音信号预加重和语音信号端点检测。针对语音识别环境存在背景噪声影响端点检测的问题,在分析各种端点检测方法的基础上,本文采用模糊聚类算法计算不同语音命令的端点检测门限值,使端点值与噪声相匹配,从而提高语音端点检测的准确率。然后对端点检测出来后的语音进行梅尔频率倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)特征参数提取,为后面的语音识别提供有效的语音信号特征数据。
   第三,在分析比较动态时间规整(Dynamic Time Warping,DTW)和HMM语音识别原理的基础上,根据护理床翻身动作语音控制系统的语音识别对象为非特定人的实际情况,选定HMM作为护理床翻身动作语音控制的语音识别算法。
   第四,针对MFCC语音特征存在数据冗余、维数高导致HMM模型训练时间长的问题,本文设计了基于PCA的HMM语音识别算法,通过用PCA降维方法对MFCC语音特征数据进行降维,保留MFCC语音特征中的主要成分,再用HMM算法进行语音的训练和识别,从而达到在确保语音识别率的前提下提高语音识别实时性。
   第五,设计了护理床翻身动作控制系统,采用VisualC#与matlab混合编程的方式开发了护理床翻身动作的语音控制系统。
   第六,对本文设计的语音识别算法进行了实验并对护理床翻身动作语音控制系统进行了调试。实验结果表明:
   (1)采用基于模糊聚类算法的端点检测方法,在有背景噪声的情况下有效地提高了语音端点检测的准确性。
   (2)通过对语音信号特征进行PCA降维在保证语音识别准确率基本不变的前提下有效的减少了语音训练的时间,提高了语音识别的实时性,取得了良好的识别效果。
   最后,本文对所进行的工作进行了总结,并给出了后续研究的建议。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号