首页> 中文学位 >应用VQ和GMM的说话人识别系统研究
【6h】

应用VQ和GMM的说话人识别系统研究

代理获取

目录

文摘

英文文摘

声明

第一章引言

1.1论文研究背景

1.2说话人识别的应用

1.3论文的组织结构

第二章说话人识别系统简介

2.1概述

2.2说话人识别的基本原理

2.3说话人识别的常用特征

2.4说话人识别的模板匹配方法

第三章语音信号预处理和特征提取

3.1语音的产生和感知

3.2语音的数学模型

3.3语音信号预处理

3.4语音信号的特征分析

第四章矢量量化

4.1概述

4.2矢量量化的基本理论

4.3矢量量化的失真测度

4.4矢量量化的最佳码本设计

4.5应用VQ的说话人识别

第五章GMM在说话人识别中的应用

5.1高斯混合模型的基本概念

5.2 GMM模型的参数估计

5.3 GMM模型的识别问题

5.4实际应用问题

第六章系统实验和研究

6.1语音信号采集和预处理

6.2应用VQ的说话人识别系统

6.3应用GMM的说话人识别系统

总结与展望

参考文献

研究生期间发表的论文

致谢

展开▼

摘要

说话人识别属于生物认证技术的一种,是一种根据语音波形中反映说话人生理和行为特征的语音参数来识别说话人身份的技术。在生物认证技术领域中,说话人识别技术以其独特的方便性、经济性等优势受到世人的关注。在保安、公安司法、军事、财经和信息服务等领域,都有着广阔的应用前景。正因为说话人识别具有如此广阔的应用前景,国内外许许多多的工作者投身于这一领域的研究中。使得说话人识别方面出现巨大发展。但它还远远没有成熟。 本文以MFCC特征参数作为识别的特征矢量集。运用矢量量化(VQ)和高斯混合模型(GMM)技术实现与文本无关的说话人识别。 本文的主要工作有:1,在特征提取部分,详细阐述了语音产生的数学模型,线性预测分析原理和L,PC、MFCC特征的提取过程。2,介绍了说话人识别的不同方法,主要介绍了矢量量化技术,其实质是在一个多维特征矢量空间中,用少数的几个特殊的点来代表空间中全部的有效点,以达到压缩、识别的目的。还介绍了高斯混合模型(GMM)的理论和应用。3,对各个系统的性能进行了研究,在VQ模型中,研究了码本尺度对系统性能的影响和阈值的选取问题。在GMM模型中,研究了高斯混合模型的阶数和帧长度对系统性能的影响。 最后对本文工作进行了总结,同时对未来的研究工作进行了展望。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号