首页> 中文学位 >基于球体分割的孤立词语音识别研究
【6h】

基于球体分割的孤立词语音识别研究

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1引言

1.2语音识别发展历史

1.2.1国外语音识别发展简介

1.2.2国内语音识别发展简介

1.3语音识别的研究难点及应用前景

1.4本文的研究内容和结构安排

第二章语音识别概述

2.1语音识别基础

2.2.1语音识别基本原理

2.1.2语音识别分类

2.2语音信号的预处理

2.2.1语音信号的预加重

2.2.2语音信号的加窗和分帧

2.2.3语音信号的端点检测

2.3特征参数的表示与提取

2.3.1线性预测系数(LPC)

2.3.2线性预测倒谱系数(LPCC)

2.3.3 Mel频率倒谱系数(MFCC)

第三章早期语音识别方法

3.1动态时间规整(DTW)

3.1.1 DTW基本算法

3.1.2 DTW仿真实验

3.1.3 DTW局限性

3.2矢量量化(VQ)

3.2.1 VQ基本原理

3.2.2失真测度

3.2.3码本设计

第四章HMM在语音识别中的应用

4.1 HMM定义

4.2 HMM的基本算法

4.2.1前向一后向算法

4.2.2Viterbi算法

4.2.3 Baum-Welch算法

4.3 HMM的类型

4.5 HMM仿真实验

4.6经典HMM的局限性

第五章BP人工神经网络在语音识别的应用

5.1 BP神经网络基本原理

5.1.1 BP网络结构

5.1.2 BP神经网络的学习

5.2 BP神经网络仿真实验

5.3 BP算法的局限性及改进

5.4几种语音识别方法的比较

第六章基于高维球体分割的语音识别方法

6.1引言

6.2语音数据的预处理

6.2.1快速傅立叶变换

6.2.2标准化过程

6.3语音样本数据的几何特征分析

6.3.1 RM空间中样本的几何特征属性

6.3.2细胞集的构造

6.4样本分布区域的构造方法

6.4.1 K均值聚类

6.4.2同类球冠集的构造

6.4.3异类球冠集的构造

6.5识别方法

6.6实验

6.6.1语音库建立

6.6.2仿真实验

6.7积极效果与不足之处

第七章工作总结与展望

致谢

参考文献

攻读硕士期间发表论文

展开▼

摘要

本文研究的主要内容包括:1.分析几种常用的语音识别方法;2.提出了基于高维球体分割的语音识别新方法。 首先,本文介绍了语音识别的基本原理、分类、语音信号的预处理和特征参数提取过程。其中预处理包括预加重、加窗、分帧、端点检测,而MFCC和LPCC则是语音识别中最常用的特征参数。 其次,讨论了几种常用的语音识别方法,包括隐马尔可夫模型(HMM)、BP人工神经网络(BPANN)以及动态时间规整(DTW),并详细阐述其原理及实现过程,进行了识别性能的比较。 然后,提出了一种新的方法--基于高维球体分割的语音识别方法。该方法通过划分高维空间的单位球体,构造高维空间中各类样本的球冠集,来描述每类样本在高维空间中的几何分布,然后通过判断未知样本属于哪个球冠集来识别该样本。 最后,将球体分割法应用于非特定人、小词汇量、孤立词的语音识别,并与HMM进行对比。实验结果表明,在相同的环境下,球体分割法取得了不比HMM逊色的识别效果,而且在时间复杂度上远远低于HMM。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号