首页> 中文学位 >基于HMM的连续语音识别系统的设计
【6h】

基于HMM的连续语音识别系统的设计

代理获取

目录

声明

第1章 绪 论

1.1选题背景

1.2国内外研究现状

1.3语音识别的分类

1.4主要研究方法

1.5 论文的结构安排

第2章 隐马尔可夫模型(HMM)

2.1概述

2.2HMM的定义

2.3HMM的三个问题

2.4HMM的基本算法

第3章 基于HMM的语音前端处理

3.1语音信号数字化和预处理

3.2 语音信号的时域分析

3.3语音信号的频域分析

3.4倒谱域分析

3.5线性预测分析

3.6 MFCC参数

第4章 HMM的软件平台——HTK

4.1HTK概述

4.2HTK软件结构

4.3简单的孤立词识别

4.4小结

第5章 基于HMM的连续语音识别系统的设计

5.1系统的整体框架

5.2数据准备

5.3创建单音素HMM模型

5.4建立决策树绑定状态的三音素

5.5识别结果

5.6 小结

第6章 总结与展望

6.1总结

6.2展望

参考文献

致谢

展开▼

摘要

语音识别是让机器能够“听懂”人类的语言,并把人类的语音信号转化为相应的文本或命令的技术。语音识别是一门涉及面很广的交叉学科,它与声学、语言学、人工智能、神经心理学、数字信号处理、计算机科学等学科都有着密切的联系。语音识别的应用范围非常广泛,比如语音打字机、数据库检索、汽车语音导航等等。
  本研究围绕语音识别介绍了语音识别的三种基本方法,基于声道模型和语音知识的方法、模板匹配的方法以及人工神经网络的方法。在模板匹配方法中最常用的方法有三种:动态时间规整(DTW)、隐马尔可夫(HMM)理论、矢量量化(VQ)。设计是基于HMM方法实现的语音识别,大多数的大词汇量、连续的、非特定人语音识别系统也都是基于HMM模型实现的。本设计是基于HTK平台,以HMM为模型,选取MFCC为特征参数,Viterbi算法作为识别基础,实现了中等词汇量、非特定人、连续语音识别系统的设计。本设计中训练句子200个,测试句子100个,测试句子正确识别了87个,句子识别率为87%。测试的句子中总共包含800个词,其中正确识别771个词,词的识别率为96.38%。通过对比单音素建模、三音素建模以及决策树绑定的三音素建模,最终得出决策树绑定的三音素HMM模型识别率最高,基于上下文相关的HMM模型具有较强的抗噪能力和稳定性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号