一种基于卷积神经网络的端到端语音分离方法

范存航; 刘斌; 陶建华; 温正棋; 易江燕

首页> 中文期刊> 《信号处理》 >一种基于卷积神经网络的端到端语音分离方法

一种基于卷积神经网络的端到端语音分离方法

AI论文写作 >>

开具论文收录证明 >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

大部分的语音分离系统仅仅增强混合的幅值谱(短时傅里叶变换的系数),但是对于相位谱却不做任何处理.然而,最近的研究表明相位信息对于语音分离的质量起着很重要的作用.为了同时利用幅值和相位信息,本文提出了一种有效的端到端分离方法.这种方法是直接利用原始语音波行点作为特征,是一种基于编解码器的卷积神经网络结构.跟其他的说话人独立的语音分离系统不同,本文提出的方法其神经网络只输出一个说话人的信号,其他的语音可以由混合语音与网络输出信号的差值获得.我们在TIMIT数据集上验证本文提出的方法.实验结果表明,本文提出的方法明显优于句子级别的排列不变性训练(utterance-level permutation invariant training,uPIT)基线方法,对于信号失真比(signal-to-distortion ratio,SDR)相对提高了16.06％.

著录项

来源
《信号处理》 |2019年第4期|542-548|共7页
作者
范存航; 刘斌; 陶建华; 温正棋; 易江燕;
展开▼
作者单位

中国科学院自动化研究所模式识别国家重点实验室;

北京100190;

中国科学院大学人工智能学院;

北京100190;

中国科学院自动化研究所模式识别国家重点实验室;

北京100190;

中国科学院自动化研究所模式识别国家重点实验室;

北京100190;

中国科学院大学人工智能学院;

北京100190;

中国科学院脑科学与智能技术卓越创新中心;

北京100190;

中国科学院自动化研究所模式识别国家重点实验室;

北京100190;

中国科学院自动化研究所模式识别国家重点实验室;

北京100190;

展开▼
原文格式 PDF
正文语种 chi
中图分类电声技术和语音信号处理;
关键词
说话人独立语音分离; 鸡尾酒会问题; 端到端; 卷积编解码器;

相似文献

中文文献
外文文献
专利

1. 基于深度优化残差卷积神经网络的端到端语音识别 [J] . 徐冬冬 ,蒋志翔 . 计算机应用研究 . 2020,第S02期
2. 一种基于路由集的VoLTE端到端语音质量问题分段定界定位方法的实现 [J] . 郑银云 . 电信工程技术与标准化 . 2021,第008期
3. 一种基于CNN/CTC的端到端普通话语音识别方法 [J] . 潘粤成 ,刘卓 ,潘文豪 . 现代信息科技 . 2020,第005期
4. 一种基于CNN/CTC的端到端普通话语音识别方法 [J] . 潘粤成 ,刘卓 ,潘文豪 . 现代信息科技 . 2020,第005期
5. 基于深层声学特征的端到端语音分离 [J] . 李娟娟 ,王丹 ,李子晋 . 计算机系统应用 . 2019,第010期
6. 基于端到端保障机制的高铁VoLTE语音MOS优化提升思路及方法研究 [C] . 原振升 ,李庆伟 ,彭中峰 . 2019广东通信青年论坛 . 2019
7. 基于生成对抗网络的端到端多语音分离技术研究 [A] . 徐丹丹 . 2018

一种基于卷积神经网络的端到端语音分离方法

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅