声明
摘要
英文缩略表
第一章 引言
1.1 问题的提出及研究意义
1.2 语音识别概述
1.2.1 语音识别的发展
1.2.2 语音识别的分类
1.2.3 基于统计模型的语音识别
1.3 影响语音识别鲁棒性的因素
1.4 语音识别及声学技术在农业领域的应用
1.4.1 国外研究情况
1.4.2 国内研究情况
1.5 研究内容
1.6 章节安排
1.7 小结
第二章 噪声鲁棒性语音识别的研究现状
2.1 噪声分类
2.1.1 加性噪声与乘性噪声
2.1.2 噪声特性分析
2.2 噪声鲁棒性方法研究现状
2.2.1 语音增强
2.2.2 鲁棒性特征提取
2.2.3 模型补偿
2.3 小结
第三章 基于HMM框架的农产品价格语音识别
3.1 HMM模型
3.1.1 HMM的概述
3.1.2 HMM的数学定义
3.1.3 HMM的三个基本问题
3.2 基于HTK的实验平台构建
3.2.1 语音数据库
3.2.2 MFCC特征提取
3.2.3 声学模型的设置
3.2.4 识别性能的评价标准
3.3 小结
第四章 系统的三音子模型优化及特征规整
4.1 扩展的声韵母建模基元
4.1.1 汉语语音学特点
4.1.2 汉语声母结构
4.1.3 汉语韵母结构
4.1.4 扩展的声韵母识别基元定义
4.2 基于决策树的状态共享
4.2.1 决策树的构造
4.2.2 二值问题集的设计
4.2.3 结点分裂准则
4.2.4 结点停止分裂
4.2.5 结点合并
4.3 增加高斯混合分量
4.4 倒谱特征归一化
4.5 实验及分析
4.5.1 实验一:三音子模型识别实验
4.5.2 实验二:决策树状态聚类
4.5.3 实验三:高斯混合分量增加
4.5.4 实验四:倒谱均值方差(CMVN)归一化
4.6 小结
第五章 联合谱减增强和失真补偿的鲁棒性方法
5.1 谱减法
5.1.1 谱减的基本原理
5.1.2 使用过减(over subtraction)技术的谱减算法
5.2 多带(multi band)谱减法
5.3 MMSE谱减算法
5.4 实验
5.4.1 实验一:MMSE谱减法参数优化实验
5.4.2 实验二:不同环境下联合算法实验
5.5 小结
第六章 基于统计模型的前端增强与失真补偿的结合
6.1 MMSE幅度谱估计
6.1.1 MMSE幅度估计器
6.1.2 先验SNR的估计
6.2 对数MMSE估计器
6.3 MMSE估计的实现
6.4 实验
6.4.1 实验一:采用MMSE估计器与logMMSE方法增强
6.4.2 实验二:MMSE、logMMSE与CMVN联合实验
6.4.3 实验三:实际环境语音测试
6.5 算法综合比较
6.6 小结
第七章 结论及展望
7.1 研究总结
7.2 展望
参考文献
致谢
作者简介