首页> 中文学位 >基于矢量量化(VQ)和混合高斯模型(GMM)的说话人识别的研究
【6h】

基于矢量量化(VQ)和混合高斯模型(GMM)的说话人识别的研究

代理获取

目录

文摘

英文文摘

东南大学学位论文独创性声明及论文使用授权声明

第一章绪论

第二章说话人识别的特征参数分析及提取

第三章说话人识别系统的识别方法

第四章遗传算法在矢量量化和高斯混合模型中的应用

第五章系统实现与实验结果

结论

致谢

参考文献

研究生期间发表的论文

展开▼

摘要

说话人识别始于20世纪30年代,从20世纪60年代开始日益成为当今的一个研究热点。说话人识别具有广泛的应用前景,如保安、公安司法、军事、财经和信息服务等领域。正因为说话人识别具有如此广阔的应用前景,国内外许许多多的工作者投身于这一领域的研究中,使得说话人识别方面出现巨大发展。但它还远远没有成熟。 本课题以语音信号的LPC倒谱系数、基音周期和维格纳-威利谱的混合特征参数作为识别的特征矢量集。运用矢量量化(VQ)和高斯混合模型(GMM)技术实现与文本有关及无关的说话人识别。在一个10人,2400个的语音库上进行了系统的识别实验。 本论文的主要工作有:1、在说话人识别系统的语音特征参数提取部分,详细阐述了声道模型、线性预测编码(LPC)分析、LPC倒谱系数、MEL倒谱系数的求解;2、介绍了说话人识别的不同方法,主要介绍了矢量量化技术及其在说话人识别中的应用,其本质是在一个解空间中用少数的几个特殊的点来代表空间中全部的有效点,以达到编码、压缩的目的。同时,还介绍了高斯混合模型(GMM)的理论和实现,包括该模型的训练和识别;3、阐述了遗传算法的基本思想和处理方法。将遗传算法的全局优化与VQ技术、GMM技术结合起来,采用科学的编码方案,动态的定标技术,高效的交叉策略,得到了模型的优化作用,提高了说话人识别率。 本篇论文从以上三方面讨论了说话人识别的理论,最后介绍了系统的实现与实验结果,并对实验结果进行了讨论、比较。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号