首页> 中文学位 >基于语音组成单位的文本无关说话人识别
【6h】

基于语音组成单位的文本无关说话人识别

代理获取

目录

文摘

英文文摘

独创性声明及关于论文使用授权的说明

第一章绪论

1.1引言

1.2说话人识别的基本原理

1.3说话人识别存在的主要困难

第二章特征提取

2.1语音的产生

2.2喉部的特征提取

2.3声道的特征提取

2.4语音频谱的特征提取

2.5小结

第三章主要的经典识别方法

3.1 HMM

3.1.1 HMM的组成部分

3.1.2 HMM的三个基本问题

3.1.3三个问题的解

3.1.4 HMM用于说话人识别

3.1.5小结

3.2 GMM

3.2.1 GMM的定义

3.2.2 GMM模型的训练

3.2.3 GMM用于说话人辨认

3.2.4小结

3.3 ANN

3.4 SVM

3.4.1 SVM简介

3.4.2 SVM用于说话人确认

3.5小结

第四章几种基于语音分类的说话人识别

4.1基于HMM的最佳“音素”归类的说话人确认

4.2 VQ

4.3构筑特定音素空间的说话人识别

4.4小结

第五章一种基于语音组成单位的说话人识别算法

5.1提取浊音

5.1.1用倒谱进行清浊音判决的原理

5.1.2修正倒谱

5.1.3浊音提取

5.2特征提取

5.2.1语音产生的全极点模型

5.2.2线性预测分析

5.3基于语音组成单位的个体建模

5.3.1聚类

5.3.2分类效果的GMM迭代优化

5.4基于语音组成单位的说话人确认

5.5基于语音组成单位的说话人辨认

5.6实验

5.7小结

第六章总结与展望

参考文献

致谢

附录 论文发表情况

展开▼

摘要

本文就特征提取、文本无关说话人识别的主要经典方法作了回顾,强调并阐释了各种方法在物理上的意义。针对文本无关说话人识别中训练语音和测试语音的内容不受制约因而不具可比性的问题,本着“在具有可比性的语音组成单位中寻找不同的身份信息”的思想,系统地提出了一种说话人识别方法。该方法提取语音中的浊音作为训练样本和测试样本。以LPC系数作为特征向量,将语音的每一帧特征向量视作一个语音组成单位。用一个高斯概率密度函数表征一个语音组成单位,以此为每个人建立语音组成单位的模型,也就是每个人语音组成单位的集合。获得模型各参数的方法是:对说话者的训练样本用k均值聚类算法进行初始聚类,得到每一个类的类心和协方差矩阵的初始值。然后利用GMM迭代算法对类心和协方差矩阵进行优化处理。把优化后的结果作为语音组成单位在特征空间中的表示,从而得到各语音组成单位在特征空间中的分布。以这个模型为基础,设计说话人识别算法。通过处理测试样本对模型中语音组成单位的匹配值,分别提出了一种对说话人进行确认和辨认的方法。两种方法的物理意义明确、可操作性强。实验结果表明,即使使用短时测试语音,上述方法也能取得较好的识别效果。最后,对全文进行总结,并对文本无关说话人识别的研究方向进行讨论。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号