首页> 中文学位 >提取耳蜗熵值的语音可懂度客观评测算法研究
【6h】

提取耳蜗熵值的语音可懂度客观评测算法研究

代理获取

目录

声明

摘要

第一章 绪论

1.1 应用背景

1.2 语音可懂度增强技术发展概述

1.3 语音主客观评测

1.3.1 语音质量评测

1.3.2 语音可懂度评测

1.4 论文主要工作与结构

第二章 语音分段提取耳蜗熵值

2.1 语音听觉机理及数字模型

2.1.1 语音信号的听觉模型

2.1.2 语音信号的感知

2.1.3 语音信号的数字模型

2.2 语音分段

2.2.1 基于短时能量和过零率的语音分段

2.2.2 基于语音自相关函数的语音分段

2.2.3 基于小波变换的语音分段

2.2.4 基于梅尔倒谱系数的语音分段

2.3 耳蜗熵值

2.3.1 耳蜗的结构和原理

2.3.2 听觉滤波器

2.3.3 耳蜗熵值提取算法

第三章 语音库

3.1 IEEE句子

3.2 语音库的录制

3.2.1 噪声抑制算法

3.2.2 多通道混响语音和抗混响语音算法

3.2.3 主观评测

第四章 语音可懂度算法

4.1 侵入式归一化协方差算法

4.2 非侵入式语音混响调制能量比算法

4.2.1 调制频谱特征提取

4.2.2 调制频谱解析

4.2.3 混响调制能量比算法

第五章 算法结果与结论

5.1 相关度评测标准

5.1.1 Pearson相关系数

5.1.2 Spearman秩相关系数

5.1.3 S形映射函数

5.1.4 均方根误差估计

5.2 耳蜗熵阈值的选取

5.3 相关度分析

5.3.1 传统NCM与基于CSE的NCM算法结果

5.3.2 传统SRMR与基于CSE的SRMR算法结果

5.3.3 NCM和SRMR算法结果

5.4 散点图比较

5.4.1 传统NCM与基于CSE的NCM算法散点图

5.4.2 传统SRMR与基于CSE的SRMR算法散点图

5.4.3 NCM和SRMR算法散点图

5.5 结论

5.5.1 提取耳蜗熵值

5.5.2 侵入式与非侵入式算法效果

第六章 总结与展望

6.1 当前工作总结

6.2 未来工作展望

参考文献

致谢

攻硕期间取得的研究成果

展开▼

摘要

语音质量和语音可懂度是语音增强领域的一个分支,语音质量评测算法的研究注重背景噪声和其他干扰的抑制过程,采用听觉方法或认识技术提高通信的可靠性和系统的鲁棒性。而语音可懂度的研究对象是语音信号本身,区别于语音质量,从另一个角度对语音信号进行增强。
  语音质量和语音可懂度尽管都属于语音增强的分支,但是对于听者接收的语音来说,语音质量是指语音的清晰程度,即其他干扰对语音的影响;而语音可懂度是指听众能够对语音的理解程度。语音质量的高低与语音可懂度的高低并不成正比。例如,即便在较高的背景噪声条件下,听者有时也能听懂语音表达的意思,有时,在安静的场合反而未必能听懂。因此,本研究从语音可懂度的角度,采用提取语音耳蜗熵值的方法对语音进行分段并提取耳蜗熵值,再利用归一化协方差算法和语音混响能量比算法计算语音的可懂度客观评测分数,通过四种相关度分析方法分别评测主观分数和客观分数的相关性,从而对语音可懂度进行客观评测。
  本研究的主要内容如下:
  1.对语音信号进行分段处理,提取耳蜗熵值。根据一定的阈值将耳蜗熵值分为高熵值和低熵值。
  2.采用归一化协方差算法和提取语音混响调制能量比算法。输入语音分别为高熵值段语音和低熵值段语音。两种可懂度算法的区别是后者摆脱了对纯净语音的依赖性,更适用于日常生活中,例如人工耳蜗的植入或者助的听器佩戴。
  研究结果表明,采用提取耳蜗熵值之后高熵值段语音的可懂度更高些,说明高熵值段语音比低熵值段语音携带有更多的语音信息。并且采用归一化协方差算法和语音混响调制能量比算法的高熵值段语音可懂度主客观相关系数都达到0.85左右,二者相差不大。但归一化协方差算法具有理想化的特点,现实生活中的语音不可能完全为纯净语音,而语音混响调制能量比算法具有无需纯净语音输入的特点,因而更具有实用性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号