首页> 中文学位 >基于计算听觉场景分析的单通道语音盲分离技术
【6h】

基于计算听觉场景分析的单通道语音盲分离技术

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1语音分离研究背景与意义

1.2计算听觉场景分析的发展历程及研究现状

1.3本论文的结构安排

第二章 计算听觉场景分析概述

2.1语音信号特征

2.2人耳的感知特性

2.3听觉场景分析理论

2.4计算听觉场景分析基础

第三章 基于Tandem算法的混叠语音分离

3.1听觉外围处理和特征提取

3.2给定基音周期标记二值模

3.3给定二值模估计目标基音

3.4迭代过程

3.5本章小结

第四章 基于CASA和谱减法的清音分离改进算法

4.1系统结构

4.2清音分离

4.3仿真实验和性能评估

4.4本章小结

第五章 基于CASA的无监督双语音分离

5.1算法结构

5.2 GFCC特征提取

5.3浊音分离

5.4清音分离

5.5仿真实验和性能评估

5.6本章小结

第6章 总结与展望

6.1论文工作总结

6.2研究工作展望

参考文献

致谢

在学期间发表的学术论文

展开▼

摘要

作为最有效直接的交流方式,语音却总是受到实际环境中各种干扰或噪声的影响。但是基于人类独特的听觉场景分析,人耳总能妥善处理各种情况,敏锐地捕获各种特定信号。利用计算机模拟人耳的感知过程并对听觉场景进行建模,实现语音分离的过程即计算听觉场景分析(Computer Auditory Scene Analysis,CASA),已成为近年来语音信号处理领域的一个研究热点。
  本文在详细分析 CASA理论知识及其经典算法的基础上,针对干扰信号为非语音信号和其他语音信号两种情况,研究基于 CASA的单通道语音分离问题。主要研究工作如下:
  针对从非语音干扰中分离语音的问题,现有的基于 CASA的算法大多集中于对浊音分离的研究,对清音分离的研究较少。本文对基于 CASA和谱减法的清音分离算法进行改进,针对原算法运算量大和清音背景噪声估计不准确的问题,在清音分离前先通过估计声音信号的开始和结束时刻(Onset/Offsett)找出可能存在清音的时频区域,并利用相邻时频单元能量具有连续性的原理,对清音时频块中每一时频单元分别进行噪声能量估计。仿真结果表明,改进算法比原算法运算量更小,对清音分离的有效性更高。
  针对干扰信号也是语音即双语音分离问题,本文提出了一种结合CASA和说话人识别的双语音分离系统。利用Tandem算法实现浊音同时组织,基于Gammatone频率倒谱系数(Gammatone frequency cepstral coefficients,GFCC)的聚类建立目标函数实现说话人识别,并通过穷举搜索或束搜索找到最佳分组,实现浊音序列组织。通过Onset/Offset分析产生清音段,并将清音段中的清音-浊音(U-V)段和清音-清音(U-U)段分别进行处理,U-V段利用已分离的浊音二值模进行分离,U-U段则简单均分给两个声源,实现清音分离。通过仿真实验和性能评估验证了所提算法的可行性和有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号