首页> 中文学位 >语音可懂度客观评价策略的研究
【6h】

语音可懂度客观评价策略的研究

代理获取

目录

声明

摘要

第一章 引言

1.1 课题研究背景及意义

1.2 语音可懂度的研究动态

1.2.1 语音客观评价方法的发晨

1.2.2 语音客观评价方法的发晨

1.3 论文主要内容与组织结构

第二章 计算听觉场景分析

2.1 语音特征

2.2 系统框架

2.3 理想二值掩蔽

2.4 本章小结

第三章 语音可懂度评价研究

3.1 语音的主观评价方法

3.1.1 平均意见得分方法

3.1.2 判断韵宇测试方法

3.1.3 词错误率

3.2 语音可懂度的客观评价方法

3.2.1 归一化协方差评价方法

3.2.2 基于可懂度指数评价方法

3.3 语音可懂度客观评价指标

3.3.1 清晰度指数

3.3.2 语音可做指数

3.3.3 语音传输指数

3.4 本章小结

第四章 短时客观可懂度测量

4.1 问置描述

4.2 STOI模型的基本过程

4.2.1 STOI模型基本框架

4.2.2 正则化与裁剪

4.3 实验仿真及结果分析

4.3.1 实验分析

4.3.2 实验性能评估

4.4 本章小结

第五章 加权晌度HIT-FA

5.1 问题描述

5.2 LWHF的基本过程

5.2.1 腐蚀与膨胀

5.2.2 响度谱计算

5.2.3 响度加权丢失错误

5.2.4 响度加权误报错误

5.3 实验仿真及结果分析

5.3.1 实验数据

5.3.2 实验设置

5.3.3 实验分析

5.3.4 对比实验与结论

5.4 本章小结

第六章 总结与展望

参考文献

致谢

展开▼

摘要

在信息时代背景下,语音是人们日常生活中最直接的信息传递与交换形式。而现实生活中,多数语音往往伴随着噪声,使人感到舒适度下降。听力受损的人理解不同背景噪声下的语音是很困难的。因此,怎样从信号中分离噪声、改善可懂度以及如何评价可懂度成为了一个重要问题。
  目前,理想二值掩蔽(Ideal Binary Mask,IBM)技术的提出,给噪声背景下评价语音可懂度提供了希望。最近研究表明每个时间-频率单元对语音可懂度重要性与语音内容相关。时间-频率单元被分为噪声主导和目标语音主导两类。本文实验结果表明每个语音存在的时间-频率单元对语音可懂度的重要性与目标语音的响度有关。
  2008年,Li和Loizou[1]研究证明,当输入信噪比在-5dB下,误报错误比丢失错误对语音可懂度的影响更大。本实验对输入混合信噪比进行了扩充,研究了不同输入混合信噪比下,两种掩蔽错误对语音可懂度的影响。本文实验证明,当混合信噪比在0dB以下时,误报错误比丢失错误对语音可懂度影响更大。理想二值掩蔽的研究大都是基于这样一个假设:每个语音分离单元对语音整体可懂度的贡献度是一样的,但没有改变IBM结构。考虑到两种掩蔽错误对语音可懂度影响程度和IBM结构对语音可懂度的影响,本文提出了对丢失错误和误报错误进行加权控制的方法,同时结合IBM结构的改变,意在提出更好的评价语音可懂度的指标。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号