首页> 中文学位 >小词汇量非特定人语音识别系统的研究
【6h】

小词汇量非特定人语音识别系统的研究

代理获取

摘要

语音识别是指使计算机能够“听懂”人类的语言,并且理解语言的内容执行特定的命令或任务。作为人机交互技术的基础,其最终目的是实现人与机器的自然交流。语音识别应用的领域非常广泛,其中,非特定人、小词汇量语音识别系统是语音识别应用领域中的一个重要分支。
   本文主要针对非特定人、小词汇量的语音识别识别系统进行了深入研究,并在此基础上编写非特定人小词汇量语音识别软件,主要工作如下:
   (1)通过分析传统端点检测算法的缺点提出了一种改进型端点检测算法--自适应双门限语音端点检测算法,仿真表明该算法具有更好的性能;分析语音识别中三种不同的特征参数:线性预测倒谱系数(LPCC)和美尔频率倒谱系数(MFCC)以及功率归一化倒谱系数(PNCC)。
   (2)介绍了目前三种主流的语音识别算法:动态时间规整(DTW)、隐马尔科夫模型(HMM)和支持向量机(SVM),分析了它们的原理、特点及实现过程,以及目前主流语音识别算法的局限性和不足。使用DTW算法和HMM算法,构建了两个小型语音识别系统,通过实验分析了如何选取HMM模型的参数并比较了DTW算法和HMM算法的适用范围。
   (3)分析了基于统计学习理论的语音识别算法--支持向量机算法,对该算法的基本原理以及使用该算法实现语音识别的流程进行了介绍,对支持向量机(SVM)的不同核函数进行分析,选用了RBF核函数,并实验分析了核函数参数及惩罚因子对语音识别的影响。
   (4)对于如何选取核函数参数及惩罚因子,传统的方法都是通过反复实验比对以及根据人为经验选择,此方法并不科学,由于对识别效果影响重大,因此本文进行了初步的研究,提出使用粒子群算法优化支持向量机参数算法,即PSO-SVM算法。使用MATLAB的GUIDE,用GUI的形式实现了基于PSO-SVM的语音识别系统,通过实验验证了该算法的有效性,在系统样本有限的情况下,该系统比HMM算法和未使用优化算法的SVM算法语音识别率要有所提高。
   (5)考虑到硬件条件和算法特点,选取DTW算法作为硬件语音识别算法。实现了以SPCE061A单片机为核心的小型嵌入式语音识别系统,介绍了硬件组成及软件部分,通过测试,证明测试结果较理想。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号