首页> 中文学位 >基于GMM-UBM的快速说话人识别方法
【6h】

基于GMM-UBM的快速说话人识别方法

代理获取

目录

基于 GMM-UBM 的快速说话人识别方法

Rapid Speaker Recognition Based On GMM-UBM

摘要

Abstract

第1章 绪 论

1.1 课题背景及研究的目的和意义

1.2 国内外在该方向上的发展历程和研究现状

1.3 本文的主要研究内容

第2章 GMM-UBM基准说话人识别系统

2.1 引言

2.2 GMM-UBM基准系统的建立

2.3 本文实验使用的语料库

2.4 基准系统实验

2.5 本章小结

第3章 基于树的挑选和特征序列重排的快速识别

3.1 引言

3.2 树形结构的挑选算法

3.3 特征序列重排的剪枝算法

3.4基于径向基函数的识别性能改进

3.5实验与分析

3.6 本章小结

第4章 说话人系统快速识别的后处理

4.1 引言

4.2 GMM-UBM说话人识别的确认环节

4.3 基于分段置信分的确认

4.4 基于概率阈值的确认

4.5 实验与分析

4.6 本章小结

结 论

参考文献

哈尔滨工业大学学位论文原创性声明及使用授权说明

致 谢

展开▼

摘要

文本无关的说话人识别,由于其实际应用下的灵活性,而成为语音识别领域的研究重点。自从1999年美国国家标准技术研究所(National Institute of Standards and Technology,NIST)举办的评测中,高斯混合模型——通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM)作为基准系统获得优异识别率后,该方向的研究都以其为基准模型,并对其进行改进。尽管说话人识别系统已经取得了比较令人满意的效果,但进行匹配前需大量的似然分计算,由于该因素的影响使得系统识别速度明显下降,因此实用性不佳。本文的主要目的是在尽量不降低识别率的前提下,减少计算量以实现快速说话人识别。
  针对说话人识别中计算量大、运行速度慢的情况,本文在基于树形结构的核心挑选算法基础上进行改进,自顶向下搜索 UBM中输出测试语音特征矢量似然分最高的分布,此后与目标说话人模型匹配时,只需计算核心分布的似然分进行识别。改进算法应用到基准系统后,核心挑选速度提高了14.7倍。鉴于特征序列对最终的识别结果无影响,因此系统结合矢量序列重排的剪枝算法后,整个系统速度提高到21.7倍,识别率略有降低。为了提高识别率,论文中将支持向量机(Support Vector Machine,SVM)中径向基核函数引入到说话人识别中,识别率提高到与基准系统一致。
  本文针对女性声音在开集识别时识别率下降明显的情况提出了概率阈值的思想,应用于基准系统后速度有所下降,识别率提高了0.7%。同时对分段置信分改进来解决部分匹配情况对最终识别结果的影响,本文中采用不同的参数来进行实验比较,最终选择每一小段的平均值作为该段的置信分,然后通过三层前馈网络形成最后的置信分,实验证明与使用似然比的基准系统比较,集内正确率提高了2.6%,集外错误率下降了2%。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号