首页> 中文学位 >基于轨线模型和VQ模型的说话人识别研究
【6h】

基于轨线模型和VQ模型的说话人识别研究

代理获取

目录

摘 要

Abstract

第1章 引言

1.1.说话人识别

1.2.研究意义

1.2.1.轨线模型

1.2.2VQ模型

1.3.工作重点和论文组织结构

第2章说话人识别技术

2.1.说话人识别系统

2.1.1.语音处理分类

2.1.2. 说话人识别系统结构

2.1.3.系统性能评价

2.1.4.现有的软件平台

2.2.主流特征

2.2.1.美尔到谱系数(MFCC)

2.2.2.线性预测倒谱系数(LPCC)

2.3.说话人识别模型

2.3.1.矢量量化模型(VO-Vector Quantization)

2.3.2.混合高斯模型GMM

2.3.3.连续隐马尔可夫模型CHMM

2.3.4.其他模型

2.4.说话人识别测试数据库

2.4.1.YOHO Corpus

2.4.2.Phonedb数据库

2.4.3.SRMC Corpus

2.5.小结

第3章 基于段模型的说话人特征时序性发掘

3.1.段模型

3.1.1.段模型的矩阵描述

3.1.2.模型参数估计

3.2.段模型在语音识别中的应用

3 2.1.元音分类

3.2.2.关键词识别的二阶处理

3.3.说话人特征时序性发掘方法

3.3.1 Delta特征(DF:Delta Feature)

3.3.2.段单位输入(SUI:Segmental UnitInput)

3.3.3.特征向量拟合法(FV:Fitting Vectors)

3.3.4.特征修正增维法(AFAE:Amending Feature andAdding Error)

3.3.5. 特征增维法(AE:AddingError)

3.4.时序性发掘实验

3.4.1.性能检测实验

3.4.2.段模型参数对性能的影响

3.5.小结

第4章 基于Trended HMM的文本相关说话人识别

4.1.Trended HMM与HMM

4.2.模型描述

4.3.模型参数估计

4.3.1.分割

4.3.2.优化

4.3.3.其它参数估计方法

4.4.Trended HMM在语音识别中的应用

4.5.文本相关的说话人识别

4.5.1.实现方式

4.5.2.实验

4.6.Trended HMM与VIV

4.7.Trended HMM优缺点

4.8.小结

第5章 基于可变电码本VQ模型的说话人识别

5.1.研究动机

5.2.基于聚类有效性分析的可变电码本VQ模型

5.2.1.C-均值法

5.2.2.BIC(Bayesian Information Criterion)

5.2.3.电码本选择准则

5.3.实验结果与分析

5.4.其他应用探讨

5.5.小结

第6章总结与展望

6.1.总结

6.2.展望

附录一主要参考文献

附录二论文发表情况

致谢

展开▼

摘要

该论文主要的研究内容是基于轨线模型和VQ模型的说话人识别.说话人识别是根据人的声音来识别人的一种生物认证技术,其以独特的方便性、经济性和准确性等优势受到世人瞩目.轨线模型是近年来在语音识别中提出的新模型,它可以充分的挖掘连续语音帧之间的时序相关性;VQ模型是一个用语音信号特征的分布中心描述说话人的个性特征而没有描述语音信号特征时序时的模型.文章把轨线模型应用于说话人识别,同时对VQ模型的电码本训练算法进行了改进.作者对说话人识别系统的多个方面进行了研究,包括特征提取、建模、模式匹配和决策.在这些工作的基础上,做了下列几个方面的改进和研究:1.段模型:连续语音帧之间的时序相关性往往包含了反应说话人个性的信息,目前主流特征只考虑到语音帧内(IntraFrame)的关系,而没有考虑到语音帧之间(InterFrame)的关系.语音信号本质上具有连续性,所以获取语音帧特征之间的时变特性,将对识别的性能带来提高.段模型的特性可以帮助我们获取语音帧间的信息.2.参数化随机轨线模型:在说话人识别系统中,经常存在训练语料不足的问题.这种情况下仍然用GMM或者HMM进行文本无关的说话人识别,其效果很差.此时,文本相关的说话人识别是一个很好的选择.参数化随机轨线模型具有很强的挖掘连续语音帧之间的时序性的能力,实现其在文本相关的说话人识别中的应用,效果要好于GMM和HMM.3.基于聚类有效性分析的VQ模型:VQ模型电码本的训练算法有一个弱点:电码本大小是人为指定的.该文借助聚类有效性分析,对常用的电码本训练算法进行了改进,其主要目的就是实现电码本大小的自动设定并提高说话人识别性能.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号