基于GMM-UBM的快速说话人识别方法

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

文本无关的说话人识别，由于其实际应用下的灵活性，而成为语音识别领域的研究重点。自从1999年美国国家标准技术研究所（National Institute of Standards and Technology，NIST）举办的评测中，高斯混合模型——通用背景模型（Gaussian Mixture Model-Universal Background Model，GMM-UBM）作为基准系统获得优异识别率后，该方向的研究都以其为基准模型，并对其进行改进。尽管说话人识别系统已经取得了比较令人满意的效果，但进行匹配前需大量的似然分计算，由于该因素的影响使得系统识别速度明显下降，因此实用性不佳。本文的主要目的是在尽量不降低识别率的前提下，减少计算量以实现快速说话人识别。
　　针对说话人识别中计算量大、运行速度慢的情况，本文在基于树形结构的核心挑选算法基础上进行改进，自顶向下搜索 UBM中输出测试语音特征矢量似然分最高的分布，此后与目标说话人模型匹配时，只需计算核心分布的似然分进行识别。改进算法应用到基准系统后，核心挑选速度提高了14.7倍。鉴于特征序列对最终的识别结果无影响，因此系统结合矢量序列重排的剪枝算法后，整个系统速度提高到21.7倍，识别率略有降低。为了提高识别率，论文中将支持向量机（Support Vector Machine，SVM）中径向基核函数引入到说话人识别中，识别率提高到与基准系统一致。
　　本文针对女性声音在开集识别时识别率下降明显的情况提出了概率阈值的思想，应用于基准系统后速度有所下降，识别率提高了0.7％。同时对分段置信分改进来解决部分匹配情况对最终识别结果的影响，本文中采用不同的参数来进行实验比较，最终选择每一小段的平均值作为该段的置信分，然后通过三层前馈网络形成最后的置信分，实验证明与使用似然比的基准系统比较，集内正确率提高了2.6%，集外错误率下降了2%。

著录项

作者
王秋雯;
展开▼
作者单位

哈尔滨工业大学;

展开▼
授予单位哈尔滨工业大学;
学科计算机科学与技术
授予学位硕士
导师姓名韩纪庆;
年度 2011
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音识别与设备;
关键词
GMM-UBM模型; 快速说话人识别; 树形结构; 支持向量机; 概率阈值;

相似文献

中文文献
外文文献
专利

1. 一种改进的基于GMM-UBM的法庭自动说话人识别系统 [J] . 王华朋 ,杨军 ,吴鸣 . 中国科学院大学学报 . 2013,第006期
2. 一种改进的基于GMM-UBM的法庭自动说话人识别系统 [J] . 王华朋 ,杨军 ,吴鸣 . 中国科学院研究生院学报 . 2013,第006期
3. 基于超音段韵律特征和GMM-UBM的文本无关的说话人识别 [J] . 许东星 ,戴蓓缮 ,刘青松 . 中国科学技术大学学报 . 2010,第002期
4. GMM-UBM和SVM在说话人识别中的应用 [J] . 李荟 ,赵云敏 . 计算机系统应用 . 2018,第001期
5. 一种基于卷积神经网络的快速说话人识别方法 [J] . 蔡倩 ,高勇 . 无线电工程 . 2020,第006期
6. 基于GMM-UBM的稳健说话人识别系统 [C] . 浦剑涛 ,郑榕 ,姜洪臣 . 第九届全国人机语言通讯学术会议 . 2007
7. 基于SlicedWasserstein距离的GMM-UBM说话人识别的研究 [A] . 刘乐 . 2019

基于GMM-UBM的快速说话人识别方法

目录

摘要

著录项

相似文献

相关主题

期刊订阅