基于正样本对比与掩蔽重建的自监督语音表示学习

张文林; 刘雪鹏; 牛铜; 陈琦; 屈丹

首页> 中文期刊> 《通信学报》 >基于正样本对比与掩蔽重建的自监督语音表示学习

基于正样本对比与掩蔽重建的自监督语音表示学习

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

文献数据库（团队版） >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

针对现有基于对比预测的自监督语音表示学习方法在训练时需要构建大量负样本,其学习效果依赖于大批次训练,需要耗费大量计算资源的问题,提出了一种仅使用正样本进行语音对比学习的方法,并将其与掩蔽重建任务相结合得到一种多任务自监督语音表示学习方法,在降低训练复杂度的同时提高语音表示学习的性能。其中,正样本对比学习任务,借鉴图像自监督表示学习中SimSiam方法的思想,采用孪生网络架构对原始语音信号进行两次数据增强,并使用相同的编码器进行处理,将一个分支经过一个前向网络,另一个分支使用梯度停止策略,调整模型参数以最大化2个分支输出的相似度。整个训练过程中不需要构造负样本,可采用小批次进行训练,大幅提高了学习效率。使用LibriSpeech语料库进行自监督表示学习,并在多种下游任务中进行微调测试,对比实验表明,所提方法得到的模型在多个任务中均达到或者超过了现有主流语音表示学习模型的性能。

著录项

来源
《通信学报》 |2022年第7期|163-171|共9页
作者
张文林; 刘雪鹏; 牛铜; 陈琦; 屈丹;
展开▼
作者单位

信息工程大学信息系统工程学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类语音识别与设备;
关键词
语音表示; 自监督学习; 无监督学习; 孪生网络;

相似文献

中文文献
外文文献
专利

1. 基于理想组合掩蔽的监督性语音增强算法 [J] . 李保明1 ,付小宁1 . 计算机科学与应用 . 2018,第004期
2. 基于小波域稀疏表示和自适应混合样本回归的图像超分辨率重建算法 [J] . 刘微容 ,张超鹏 ,刘朝荣 . 兰州理工大学学报 . 2018,第003期
3. 自监督聚类重训练的语音表示学习 [J] . 张文林 ,刘雪鹏 ,牛铜 . 模式识别与人工智能 . 2022,第5期
4. 字典学习和稀疏表示的无监督语音增强算法 [J] . 李轶南 ,贾冲 ,张立伟 . 计算机应用 . 2014,第0z1期
5. 一种基于人耳掩蔽效应和无语音概率的谱减语音增强算法 [J] . 王霞 ,卢建国 ,张秀珍 . 现代电子技术 . 2008,第10期
6. 基于问题与答案共同表示学习的半监督问题分类方法 [C] . Dong Zhang ,张栋 ,Shoushan Li . 第十五届全国计算语言学学术会议（CCL2016）暨第四届基于自然标注大数据的自然语言处理国际学术研讨会（NLP-NABD-2016） . -1
7. 基于稀疏表示和深度学习的有监督语音增强算法研究 [A] . 朱媛媛 . 2020

基于正样本对比与掩蔽重建的自监督语音表示学习

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅