首页> 中文会议>第十三届全国人机语音通讯学术会议 >基于深度神经网络和Bottleneck特征的说话人识别系统

基于深度神经网络和Bottleneck特征的说话人识别系统

页面导航

摘要
著录项
相似文献
相关主题

摘要

近来,一种结合语音识别中深度神经网络(deep neural networks,DNN)模型和说话人识别中身份认证矢量(identity vector,i-vector)模型的方法被证明对说话人识别十分有效.该模型在提取充分统计量的过程中,利用基于音素状态标签的DNN模型代替原i-vector模型中的通用背景模型(universal background model,UBM)来计算每帧对各个类别的后验概率,然后通过结合这些后验概率和短时频谱特征提取得到充分统计量以完成i-vector模型训练和特征映射.为了进一步提升系统性能,本文提出使用基于说话人标签的DNN模型提取Bottleneck特征代替该模型中的短时频谱特征来计算充分统计量,从而使统计量中包含更多有利于说话人识别的信息.在美国国家标准技术局说话人识别库2008年度女性电话对电话英语测试任务上进行的实验证明了该方法的有效性.相比于原来的短时频谱特征,基于Bottleneck特征的说话人识别系统性能在等错误率和最小检测代价上相对提升了7.65％和5.71％.

著录项

来源
《第十三届全国人机语音通讯学术会议》|2015年|1-6|共6页
会议地点天津
作者
TIAN Yao; 田垚; CAI Meng; 蔡猛; HE Liang; 何亮; LIU Jia; 刘加;
展开▼
作者单位

中国中文信息学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类语音识别与设备;
关键词
语音识别; 深度神经网络; Bottleneck特征; 等错误率; 最小检测代价;
入库时间 2022-08-17 11:14:29

相似文献

中文文献
外文文献
专利

1. 基于均值特征和改进深度神经网络的说话人识别算法 [J] . 罗春梅 ,张风雷 . 声学技术 . 2021,第4期
2. 低数据资源条件下基于Bottleneck特征与SGMM模型的语音识别系统 [J] . 吴蔚澜 ,蔡猛 ,田垚 . 中国科学院大学学报 . 2015,第001期
3. 低数据资源条件下基于Bottleneck特征与SGMM模型的语音识别系统 [J] . 吴蔚澜 ,蔡猛 ,田垚 . 中国科学院研究生院学报 . 2015,第001期
4. 基于多分形谱及特征优选的说话人识别系统 [J] . 周宇欢1 ,张亮2 . 计算机科学与应用 . 2018,第011期
5. 基于听觉模型特征的与文本无关说话人识别系统 [J] . 卢小春 ,尹俊勋 ,王修信 . 广西师范大学学报（自然科学版） . 2010,第002期
6. 基于MFCC和LPC特征的说话人识别系统 [C] . YANG Qin ,杨琴 ,XU Li-mei . 2018年全国声学大会 . 2018
7. 基于深度神经网络说话人识别方法研究 [A] . 张成尧 . 2020

基于深度神经网络和Bottleneck特征的说话人识别系统

摘要

著录项

相似文献

相关主题

期刊订阅