首页> 中文学位 >基于HMM的连续语音识别技术研究
【6h】

基于HMM的连续语音识别技术研究

代理获取

目录

声明

摘要

1绪论

1.1引言

1.2研究背景与意义

1.3连续语音识别技术的发展及研究现状

1.3.1国外连续语音识别技术的发展

1.3.2我国连续语音识别技术发展简介

1.3.3语音识别技术的研究现状

1.4连续语音识别技术的难点

1.5论文组织结构

2语音信号分析

2.1预处理

2.2语音信号的时域特征分析

2.2.1短时能量

2.2.2短时平均过零率

2.3语音信号的频域特征分析

2.4语音信号的倒谱域特征分析

2.4.1绘制基音周期轨迹

2.4.2梅尔频率倒谱系数

2.5本章小结

3语音识别模型

3.1矢量量化

3.2高斯混合模型

3.2.1高斯混合模型的原理

3.2.2高斯混合模型的参数估计

3.2.3高斯混合模型的初始化

3.2.4高斯混合模型的识别

3.3隐马尔可夫模型

3.3.1隐马尔可夫模型的基本思想

3.3.2隐马尔可夫模型的的基本问题

3.3.3基于高斯混合模型的隐马尔可夫模型

3.4本章小结

4汉语连续语音切分技术

4.1双门限端点检测技术

4.2基于倒谱的端点检测技术

4.3汉语连续语音切分

4.3.1相干分析

4.3.2基音周期轨迹检测

4.3.3语谱图灰度均值分析

4.3.4汉语连续语音的多级切分方法

4.4本章小结

5汉语语音识别的语言模型

5.1声学模型

5.1.1基本声学单元

5.1.2词典

5.1.3声调

5.1.4基于子词单元的HMM训练

5.2语言学模型

5.2.1 N元文法语言学模型

5.2.2语言学模型的平滑技术

5.2.3语音识别的搜索算法

5.3汉语连续语音识别系统实现

5.3.1系统框架设计

5.3.2系统测试

5.4本章小结

6总结与展望

致谢

参考文献

附录

展开▼

摘要

进入二十一世纪,人工智能飞速发展,语音识别技术是人工智能的一个重要方面。随着软硬件技术的发展,连续语音识别技术已经取得很大进展。连续语音识别系统的性能与两个重要因素有关,一是语音识别模型,二是连续语音切分。对于语音识别模型,可以选取对时序信号有着较强处理能力的隐马尔可夫模型或者拥有自主学习能力的人工神经网络模型。本文对比分析了三种常用的语音识别模型,选取隐马尔可夫模型研究了汉语连续语音识别技术。连续语音的切分一直是语音识别技术的一个难点,在海量训练语音条件下,通过基于模型的切分方法能够在一定程度上实现连续语音切分;当训练语音不足时,汉语连续语音的切分就会存在很多问题。本文分析了汉语的发音特点和语音结构特征,利用语谱图和基音周期轨迹,研究了汉语连续语音的多级切分方法。全文的主要研究内容如下: (1)语音信号特征分析。对汉语连续语音识别来说,切分是一个难点。要想实现连续语音的切分,首先需要了解汉语语音信号的特点。本文分析了汉语语音信号在不同域的特性,着重利用语谱图分析了语音信号的频谱特征,利用倒谱特征获得了浊音信号的基音周期轨迹。 (2)语音识别模型对比分析。本文研究了三种语音识别模型,分别是矢量量化、高斯混合模型和隐马尔可夫模型。利用现有实验语音库对三种语音识别模型进行了对比实验,分析各个模型的优缺点。 (3)汉语连续语音多级切分方法。本文首先研究了基于时域特征参数的端点检测技术和基于倒谱的端点检测技术,分析了现有语音切分技术存在的不足。然后在分析汉语语音信号特征的基础上,利用相干分析、基音周期轨迹和语谱图灰度均值分析等技术,研究了汉语连续语音的多级切分方法。本文利用多级切分技术对麦克风信道下的连续汉语语音进行切分实验,切分准确率达到91%左右。相较于基于时域特征的切分方法和基于频域特征的切分方法,多级切分方法的准确率有着显著提升。

著录项

  • 作者

    曹冠彬;

  • 作者单位

    南京理工大学;

  • 授予单位 南京理工大学;
  • 学科 计算机技术
  • 授予学位 硕士
  • 导师姓名 张二华;
  • 年度 2017
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类
  • 关键词

    HMM;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号