首页> 中文学位 >复杂多说话人情境下基于单通道、无监督式的目标说话人语音提取方法研究
【6h】

复杂多说话人情境下基于单通道、无监督式的目标说话人语音提取方法研究

代理获取

目录

第一个书签之前

摘要

Abstract

第一章 绪论

1.1 研究背景

1.2语音分离的研究现状

1.2.1语音增强研究现状

1.2.2 多通道语音分离研究现状

1.2.3 单通道语音分离研究现状

1.3 主要研究内容及结构

第二章 语音段类别划分

2.1 教师类别获取

2.1.1 高斯混合模型

2.1.2 K-means

2.1.3 GMM+Kmeans

2.2 静音及重叠语音段的获取

2.2.1 基于静音帧统计的静音及重叠语音类别检测

2.2.2 GMM语音识别

2.2.3 最终静音及重叠语音类别的确定

第三章 语音分离

3.1单通道信号概念

3.2 独立成分分析

3.2.1 ICA的原理

3.2.2 FastICA

3.3 非负矩阵分解

3.3.1 非负矩阵分解简介

3.3.2 CNMF

3.3.3 CNMF在语音分离中的应用

3.4 JADE算法

3.5 CNMF+JADE

3.6 语音分离结果分析

3.6.1 语音分离评价方法

3.6.2 CNMF+JADE语音分离实验结果及分析

3.6.3 语音分离对比实验数据及方法介绍

3.6.4 语音分离对比实验结果及分析

第四章 语音增强

4.1 传统语音增强方法

4.1.1 基于谱减法的语音增强

4.1.2 基于维纳滤波的语音增强

4.1.3 基于卡尔曼滤波的语音增强

4.1.4 基于小波变换的语音增强

4.2 基于自适应小波变换语音增强

4.3 语音增强实验结果及分析

4.3.1 初步语音增强实验

4.3.2 自适应小波变换语音增强实验

4.3.3 与基于深度学习的结果比较

第五章 目标说话人语音提取

5.1 目标说话人语音提取流程

5.2 语音分离前端处理

5.3 实验数据集

5.4 目标说话人语音提取实验

第六章 总结与展望

6.1 总结

6.2 展望

参考文献

致谢

攻读硕士研究生期间科研情况及发表论文

展开▼

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号