首页> 中文学位 >基于语音识别的电话交换系统中关键技术的研究
【6h】

基于语音识别的电话交换系统中关键技术的研究

代理获取

目录

文摘

英文文摘

独创性(或创新性)声明及关于论文使用授权的说明

第一章绪论

1.1语音识别概述

1.2研究历史与现状

1.3语音识别的发展前景

1.4课题的主要内容和意义

1.5主要研究成果

1.6论文结构和内容

第二章语音识别基本原理

2.1基于模式识别的语音识别系统模型

2.2基于统计理论的语音识别模型

2.3语音特征提取

2.3.1 时域特征参数

2.3.2频域特征参数

2.3.3动态特征提取

2.3.4特征矢量归一化(Feature Vector Normalization)

第三章基于语音识别的电话自动总机系统

3.1系统设计

3.2电话语音数据的采集

3.3电话语音数据库

第四章隐马尔可夫模型(HMM)及其在语音识别中的应用

4.1 HMM的基本理论

4.1.1 HMM的定义

4.1.2 状态转移的拓扑结构

4.1.3 状态输出概率bj(ot)的形式

4.2 HMM的三个基本问题

4.3基于HMM的语音识别系统

4.4 HMM的判别训练方法

4.4.1 传统的基于ML的训练方法

4.4.2 判别学习方法

4.4.3 基于最小分类错误(MCE)准则的训练方法

第五章基于HMM非特定内容、非特定人孤立词识别系统

5.1概述

5.2声学模型

5.2.1 声学单元

5.2.2 模型训练

5.2.3 整词模型拼接

5.3系统实现及其问题

第六章总结与展望

参考文献

致谢

展开▼

摘要

该论文的主要研究内容是基于隐马尔可夫模型的语音识别及其在电信领域中的应用.该文对非特定人孤立词语音识别从多个角度进行了研究,实现了一个非特定人的汉语人名语音识别实验系统.在该系统上做了以下几方面的研究:1.特征提取与变换:分析讨论了LPCC和MFCC两种常用的语音特征,通过实验对两种特征做了比较,结果表明MFCC特征比LPCC特征更有效,然而计算量也稍微大一些.另外,通过实验探讨了动态特征、特征归一化手段对识别系统的影响.2.训练方法的改进:HMM用高斯混合模型的概率密度函数来模拟语音特征的分布,但是这种模拟和实际情况有一些偏差.另外,基于最大似然(ML)准则的训练方法只用同一个词的不同说话人发音数据来训练,不能有效的描述不同词之间的发音差异特性.而基于最小分类错误(MCE)准则的训练方法有效的增加了声学模型的区分能力.该论文讨论了基于MCE准则的训练方法,对其优化过程进行了仔细的探讨,并在孤立词人名语音识别中实现.3.非特定内容(可变词表)、非特定人孤立词识别系统:基于整词模型的特定内容(词表)孤立词识别系统的应用范围是有限的.它的词表变更需要重新采集语音数据并且训练,对系统的修改很大.而非特定内容的孤立词识别系统,可以随意修改识别的词表,这样就可以非常便利的将孤立词识别系统应用到各个领域.我们结合汉语的发音特点,在汉语连续语音识别的基础上着重研究了非特定内容的孤立词语音识别系统中的声学单元选择、训练以及整词模型拼接的问题,对系统性能上存在的问题进行了讨论.在上述孤立词语音识别系统的基础上,该论文初步设计了一个基于语音识别的电话自动转接系统的方案.讨论了系统的软、硬件设计,电话语音数据采集及其语音数据库的建立.语音数据库包括人名语音数据库和电话转接语音数据库,并已经实际采集了少量规模的电话语音数据.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号