首页> 中文学位 >基于语音识别基元声学整体结构特征的识别模型研究
【6h】

基于语音识别基元声学整体结构特征的识别模型研究

代理获取

目录

文摘

英文文摘

独创性声明及关于论文使用授权的说明

第一章语音识别概述

1.1序言

1.2语音识别研究的历史与现状

1.3语音识别学科与其它学科的关系

1.4语音识别主要研究的技术问题

1.5性能评测体系、语料库与主要技术成果

1.6本文的主要研究工作和论文的安排

第二章基于Bayes模式的语音识别模型分析

2.1语音识别研究的基本问题

2.2模板匹配模型

2.2.1 VQ模型

2.2.2 DTW模型

2.3统计概率匹配模型

2.3.1 HMM模型

2.3.2 SM模型

2.4动态规整搜索算法的连续语音识别系统模型解析

2.5小结

第三章语音端点检测技术[C3][C4][C9]

3.1引言

3.2基于语音时域特征参数的端点检测方法

3.3基于语音频域特征参数的端点检测方法

3.4基于字(词)结构时域特征的汉语连续语音端点检测[C3][C9]

3.4.1基于汉语字(词)短时峰谷点能量的端点检测方法

3.4.2实验语料与测试数据

3.4.3检测方法性能分析

3.5基于多子带谱特征的汉语连续语音端点检测[C4][C9]

3.5.1时域端点检测方法存在的问题

3.5.2基于汉语频域特征的端点检测算法

3.5.3实验数据与分析

3.6非确定性噪音环境下的脉冲整形法

3.7小结

第四章多种语音特征参数的识别性能分析

4.1引言

4.2线性预测系数特性分析

4.3频域滤波器组设计

4.4各种倒谱系数计算方法与物理特性分析

4.5距离测度

4.6各种特征的识别性能比较

4.7小结

第五章汉字音节整体结构识别模型设计与性能分析[C1]

5.1汉语语音特点简述

5.2汉语语音识别模型与性能

5.3对汉语识别声学模型的深层分析[C1]

5.4汉字音节MFCC向量整体模型的实现[C1]

5.5实验与数据分析

5.5.1帧数固定和帧长固定的汉字音节整体MFCC向量模型识别性能

5.5.2某些影响汉字音节整体MFCC向量模型识别率的参数分析

5.6小结

第六章数字语音识别模型结构的比较性研究[C2][C5][C7][C8]

6.1引言

6.2数字语音的基本特点

6.3基于固定帧长观测向量序列的DTW结构的数字语音识别模型[C2]

6.4基于固定帧数观测向量序列的DTW结构的数字语音识别模型[C2][C8]

6.5基于数字语音时频信息整体结构的单特征向量识别模型[C7]

6.6数字语音MFCC向量序列整体模型的降噪设计与分析[C5]

6.6.1模型的降噪设计与分析

6.6.2数字语音识别算法处理流程

6.6.3实验数据与分析

6.7小结

第七章总结与展望

参考文献

致 谢

个人简历、在学期间参加的科研项目及发表的学术论文

展开▼

摘要

本文主要致力于自然和电话语音的端点检测、汉语音节整体结构声学识别模型的构造、低信噪比下稳健的英语数字识别模型设计与性能分析,并通过反复的实验证明新的算法和模型是可行有效的。  本文主要包括以下创新之处:  (1)提出了基于汉字音节短时峰谷点能量的端点检测算法。实验数据显示汉语音节端点的检测率达到96﹪以上。  (2)设计了基于多子带谱特征的汉语端点检测算法。该算法的平均检测率大于97﹪。  (3)设计了适合窄带电话的帧时域能量与主频带能量(300~1500Hz)的混合脉冲检测模式,通过对脉冲序列的整形、滤除合并、位置微调确定数字端点。  (4)设计了一种新的基于汉字音节整体MFCC向量模型。在同样的测试条件下,固定帧数比固定帧长的识别率提高3.0﹪以上。  (5)提出了基于数字语音时频信息整体结构的单特征向量模型,极大地改善了识别模型对多种语音环境的适应能力。实验数据显示,增加新的处理模块后错识率至少降低30﹪,最高的降低了68.71﹪。  (6)提出并设计了小训练样本集下结合置信度评测的自适应反馈学习数字语音识别模型。实测结果显示这种模型较之最佳的基于DTW结构的混合域模型的错识率下降50﹪以上。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号