监督性语音分离中训练目标的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

语音分离是指从带有噪声的混合语音信号中提取出需要的目标语音信号，应用于鲁棒性语音识别、助听器设计和移动语音通信等领域。当前的语音分离技术在真实场景中的语音分离性能仍有待进一步提升。语音分离问题按照通道数分为单通道和多通道语音分离，本文主要研究单通道语音分离问题。
　　语音分离问题可以被看做一个监督性学习问题，通过监督性学习算法加以解决。而对于监督性语音分离算法，训练目标是其中的关键环节之一，对分离性能有着重要影响。目前最常用的训练目标有理想二值掩蔽和理想浮值掩蔽，二者都是在假设纯净语音与噪声相互独立的条件下成立，在真实场景中难以满足。而复数域上的理想浮值掩蔽和相敏掩蔽考虑了语音信号的相位信息，不易于估计，因而实际分离效果仍不甚理想。
　　相较于这些常用的时频掩蔽，本文所采用的优化浮值掩蔽，考虑了纯净语音与噪声间的相关性，符合真实场景中语音分离的条件。本文将其与监督性语音分离技术相结合，以优化浮值掩蔽作为分离目标，提出了解决语音分离问题的新方案。本文在多种噪声环境和信噪比条件下进行了仿真实验，并与几种目前常用训练目标进行对比分析，实验结果表明，本文所提出的方法进一步改善了语音分离的效果，更加适用于真实场景中的语音分离问题。考虑到优化浮值掩蔽是基于纯净语音与噪声的相关性信息，本文中进一步对更具有挑战性的不同人声之间的语音分离做了仿真实验，实验结果表明本文提出的分离方法对于不同说话人语音的分离同样具有性能优势。
　　单通道语音去混响问题也是语音信号处理领域的研究重点之一。近年随着深度学习的推进，研究者们将深度学习应用于语音去混响问题，取得了不错的效果。本文将提出的语音分离方法用于实现语音去混响，实验结果表明去混响效果得到了一定程度的提升。

著录项

作者
夏莎莎;
展开▼
作者单位

内蒙古大学;

展开▼
授予单位内蒙古大学;
学科计算机科学与技术
授予学位硕士
导师姓名张学良;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音识别与设备 ;
关键词
深度神经网络; 语音分离; 监督性学习; 计算目标;

相似文献

中文文献
外文文献
专利

1. 知觉训练在第二语言语音习得中的作用——兼论对外汉语的语音习得和教学研究 [J] . 张林军 . 云南师范大学学报（对外汉语教学与研究版） . 2010 ,第001期
2. 低信噪比下联合训练生成对抗网络的语音分离 [J] . 王涛 ,全海燕 . 计算机工程与科学 . 2021 ,第006期
3. 一种改进LSTM训练的语音分离技术 [J] . 郭佳敏 ,李鸿燕 . 电子设计工程 . 2021 ,第011期
4. 基于生成对抗网络联合训练的语音分离方法 [J] . 王涛 ,全海燕 . 信号处理 . 2020 ,第006期
5. 基于语音个人特征信息分离的语音转换方法研究 [J] . 马振 ,张雄伟 ,杨吉斌 . 信号处理 . 2013 ,第004期
6. 啼哭训练法在脑瘫患儿语音康复训练中的应用体会 [C] . SHI Wenhong ,史文红 ,ZHI Yuanyuan . 第9届北京国际康复论坛 . 2014
7. 基于实数频谱的监督性语音分离 [A] . 刘允 . 2019

监督性语音分离中训练目标的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅