基于矢量量化（VQ）和混合高斯模型（GMM）的说话人识别的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

说话人识别始于20世纪30年代，从20世纪60年代开始日益成为当今的一个研究热点。说话人识别具有广泛的应用前景，如保安、公安司法、军事、财经和信息服务等领域。正因为说话人识别具有如此广阔的应用前景，国内外许许多多的工作者投身于这一领域的研究中，使得说话人识别方面出现巨大发展。但它还远远没有成熟。本课题以语音信号的LPC倒谱系数、基音周期和维格纳-威利谱的混合特征参数作为识别的特征矢量集。运用矢量量化(VQ)和高斯混合模型(GMM)技术实现与文本有关及无关的说话人识别。在一个10人，2400个的语音库上进行了系统的识别实验。本论文的主要工作有：1、在说话人识别系统的语音特征参数提取部分，详细阐述了声道模型、线性预测编码(LPC)分析、LPC倒谱系数、MEL倒谱系数的求解；2、介绍了说话人识别的不同方法，主要介绍了矢量量化技术及其在说话人识别中的应用，其本质是在一个解空间中用少数的几个特殊的点来代表空间中全部的有效点，以达到编码、压缩的目的。同时，还介绍了高斯混合模型(GMM)的理论和实现，包括该模型的训练和识别；3、阐述了遗传算法的基本思想和处理方法。将遗传算法的全局优化与VQ技术、GMM技术结合起来，采用科学的编码方案，动态的定标技术，高效的交叉策略，得到了模型的优化作用，提高了说话人识别率。本篇论文从以上三方面讨论了说话人识别的理论，最后介绍了系统的实现与实验结果，并对实验结果进行了讨论、比较。

著录项

作者
许百林;
展开▼
作者单位

东南大学;

展开▼
授予单位东南大学;
学科信号与信息处理
授予学位硕士
导师姓名赵力;
年度 2005
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音识别与设备;
关键词
说话人识别; 矢量量化; 高斯混合模型; LPC倒谱系数; 遗传算法; 语音特征; 参数提取;

相似文献

中文文献
外文文献
专利

1. 基于说话人特有特征集的GMM和i-矢量方法的说话人识别 [J] . 沈思秋 ,吕勇 ,杨芸 . 电子设计工程 . 2014,第023期
2. 基于Sugeno测度的动态不可加双矢量量化说话人识别研究 [J] . 田景峰 ,赵振东 ,胡喜梅 . 华北电力大学学报(自然科学版) . 2010,第006期
3. 基于矢量量化的说话人识别研究 [J] . 周星 ,王成友 ,孟晨 . 计算机工程与设计 . 2002,第011期
4. 基于小波变换的快速矢量量化(VQ)编码 [J] . 贺添 ,麻冰涓 . 河南理工大学学报（自然科学版） . 2006,第002期
5. 基于矢量量化的说话人识别系统硬件实现 [J] . 何赞园 ,王凯 ,吉立新 . 现代电子技术 . 2022,第1期
6. 矢量量化和VQ-UBM在说话人确认中的应用 [C] . 展领 ,景新幸 . 中国声学学会2009年青年学术会议 . 2009
7. 利用矢量量化（VQ）和混合高斯模型（GMM）的说话人识别的研究 [A] . 王吉林 . 2004

基于矢量量化（VQ）和混合高斯模型（GMM）的说话人识别的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅