声明
摘要
第一章 绪论
1.1 应用背景
1.2 语音可懂度增强技术发展概述
1.3 语音主客观评测
1.3.1 语音质量评测
1.3.2 语音可懂度评测
1.4 论文主要工作与结构
第二章 语音分段提取耳蜗熵值
2.1 语音听觉机理及数字模型
2.1.1 语音信号的听觉模型
2.1.2 语音信号的感知
2.1.3 语音信号的数字模型
2.2 语音分段
2.2.1 基于短时能量和过零率的语音分段
2.2.2 基于语音自相关函数的语音分段
2.2.3 基于小波变换的语音分段
2.2.4 基于梅尔倒谱系数的语音分段
2.3 耳蜗熵值
2.3.1 耳蜗的结构和原理
2.3.2 听觉滤波器
2.3.3 耳蜗熵值提取算法
第三章 语音库
3.1 IEEE句子
3.2 语音库的录制
3.2.1 噪声抑制算法
3.2.2 多通道混响语音和抗混响语音算法
3.2.3 主观评测
第四章 语音可懂度算法
4.1 侵入式归一化协方差算法
4.2 非侵入式语音混响调制能量比算法
4.2.1 调制频谱特征提取
4.2.2 调制频谱解析
4.2.3 混响调制能量比算法
第五章 算法结果与结论
5.1 相关度评测标准
5.1.1 Pearson相关系数
5.1.2 Spearman秩相关系数
5.1.3 S形映射函数
5.1.4 均方根误差估计
5.2 耳蜗熵阈值的选取
5.3 相关度分析
5.3.1 传统NCM与基于CSE的NCM算法结果
5.3.2 传统SRMR与基于CSE的SRMR算法结果
5.3.3 NCM和SRMR算法结果
5.4 散点图比较
5.4.1 传统NCM与基于CSE的NCM算法散点图
5.4.2 传统SRMR与基于CSE的SRMR算法散点图
5.4.3 NCM和SRMR算法散点图
5.5 结论
5.5.1 提取耳蜗熵值
5.5.2 侵入式与非侵入式算法效果
第六章 总结与展望
6.1 当前工作总结
6.2 未来工作展望
参考文献
致谢
攻硕期间取得的研究成果