基于深度学习和矢量量化的说话人识别研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

说话人识别是用来进行身份确认的一种认证技术，通常也被称为声纹识别。它通过不同说话人语音中的个性特征来识别说话人身份，具有操作方便，设备成本低等优势，并被应用于证券银行、军事国防以及公安司法等领域。深度学习是近年来发展比较迅速的一种深层机器学习模型，其本质上是多层非线性的神经网络，可以对复杂的数据关系进行建模。本文将深度学习应用在说话人识别中，优化说话人语音个性特征，提高系统性能，主要工作如下： 1.介绍了深度学习基本理论并总结了该网络在说话人识别中优势和应用深度神经网络是具有多个隐层的复杂网络模型，本文阐述了深度置信网络的基本原理，并与其他模型进行了对比，进一步分析了深度神经网络在说话人识别中的优势，总结了国内外研究者对深度置信网络的研究和应用。 2.研究了基于Bottleneck-VQ的说话人识别方法说话人语音时长有限会导致模型学习不充分，进而影响系统的识别率。深度置信网络可以更好地在有限的语音中捕捉到说话人的个性特征。本文通过深度置信网络提取Bottleneck特征，然后结合矢量量化方法，构成基于Bottleneck-VQ的说话人识别系统。通过仿真实验，表明在说话人语音时长不超过10s的短时条件下，基于Bottleneck-VQ模型识别率比传统VQ有10%的提升。 3.研究了基于Auto-Encoder DBN-VQ的说话人识别方法噪声环境下的语音对说话人识别系统性能影响非常大，本文采用深度置信网络构造深度自动编码置信网络，可以对说话人语音中的噪声进行有效过滤，然后结合VQ构成基于Auto-Encoder DBN-VQ的说话人识别系统。实验结果证明，基于Auto-Encoder DBN-VQ的说话人识别系统比VQ以及GMM等系统在噪声条件下识别率平均提升15%。

著录项

作者
刘俊坤;
展开▼
作者单位

南京邮电大学;

展开▼
授予单位南京邮电大学;
学科电子与通信工程
授予学位硕士
导师姓名李燕萍;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类
关键词
深度学习; 矢量量化;

相似文献

中文文献
外文文献
专利

1. 基于Sugeno测度的动态不可加双矢量量化说话人识别研究 [J] . 田景峰 ,赵振东 ,胡喜梅 . 华北电力大学学报(自然科学版) . 2010,第006期
2. 基于矢量量化的说话人识别研究 [J] . 周星 ,王成友 ,孟晨 . 计算机工程与设计 . 2002,第011期
3. 基于矢量量化的说话人识别系统硬件实现 [J] . 何赞园 ,王凯 ,吉立新 . 现代电子技术 . 2022,第1期
4. 说话人识别中基于聚类特征的矢量量化技术 [J] . 徐利敏 ,唐振民 ,何可可 . 计算机工程与应用 . 2007,第027期
5. MATLAB环境下基于矢量量化的说话人识别系统 [J] . 宋敏 ,刘幺和 ,谭保华 . 湖北工业大学学报 . 2006,第006期
6. 矢量量化与协方差矩阵结合的说话人识别方法 [C] . 龙川 ,景新幸 ,杨海燕 . 中国声学学会2010年全国会员代表大会暨学术会议 . 2010
7. 基于矢量量化的说话人识别的研究 [A] . 涂佩佩 . 2016

基于深度学习和矢量量化的说话人识别研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅