首页> 中文学位 >基于GMM的说话人识别系统研究与实现
【6h】

基于GMM的说话人识别系统研究与实现

代理获取

目录

文摘

英文文摘

声明

第1章绪论

1.1说话人识别研究的目的与意义

1.2说话人识别发展历史和研究现状

1.3论文工作的主要内容

第2章说话人识别技术概述

2.1说话人识别的分类

2.2说话人识别的基本原理和系统结构

2.3说话人识别模式匹配方法

2.3.1模板匹配法

2.3.2概率统计模型法

2.4说话人识别系统性能评价

2.5本章小结

第3章说话人识别语音前端处理和特征提取

3.1语音信号预处理

3.2基于减谱法语音增强的语音前端处理

3.2.1减谱法语音增强基本原理

3.2.2改进减谱法语音增强

3.2.3减谱法语音增强应用于前端处理实验

3.3说话人识别特征提取

3.3.1基音特征参数提取

3.3.2 LPCC特征参数提取

3.3.3 MFCC特征参数提取

3.4本章小结

第4章基于VQ的说话人识别系统研究与实现

4.1系统基本结构

4.2矢量量化基本原理

4.2.1 VQ基本原理

4.2.2 LBG算法

4.2.3初始码本的选定

4.3系统具体实现

4.3.1语音数据库建立

4.3.2系统模型的训练与识别

4.4实验结果及其分析

4.4.1码本容量对说话人识别系统性能的影响

4.4.1不同的样本训练时间和测试时间对系统性能的影响

4.5本章小结

第5章基于GMM的说话人识别系统研究与实现

5.1系统基本结构

5.2高斯混合模型GMM

5.2.1模型描述

5.2.2模型参数估计

5.2.3模型参数初始化

5.3系统具体实现

5.3.1语音数据库

5.3.2系统模型的训练与识别

5.4实验结果及其分析

5.4.1 GMM混合度对系统识别率的影响

5.4.2不同训练语音时长和测试时长对系统识别率的影响

5.4.3噪声环境下说话人识别系统分析

5.5基于VQ和GMM识别系统的性能比较

5.6本章小结

第6章总结与展望

6.1论文工作总结

6.2未来工作展望

致 谢

参考文献

攻读学位期间发表的论文和参加的科研项目

展开▼

摘要

说话人识别也称声纹识别,其目的是根据说话人的声音特征来完成说话人的辨认或确认。随着网络信息化技术的迅猛发展,身份验证的数字化、隐性化、便捷化显得越来越重要,说话人识别作为一种生物认证技术,在视觉监控、身份验证、司法刑侦及金融安全等领域有着广泛应用前景,成为当前语音信号处理领域的研究热点。院话人识别技术研究的关键是语音信号的特征提取和模式匹配等问题。本文在研究当前说话人识别主要算法的基础上,通过研究基于声学特性的倒谱特征提取方法和基于模板匹配及概率统计的模式匹配方法,研究实现了基于矢量量化VQ的说话人识别系统,重点研究设计了与文本无关的基于混合高斯模型GMM的说话人识别系统。
   论文主要研究内容如下:
   (1)总结归纳说话人识别技术的发展、研究热点和难点,分析讨论了现有说话人识别主要算法。
   (2)分析研究了说话人识别语音预处理,重点对减谱法语音增强算法进行了改进,通过实验分析了语音增强效果,提高了噪声环境下的说话人识别系统的鲁棒性;研究了说话人识别的特征提取原理和方法,仿真实现了说话人基音特征、LPCC和MFCC参数及差分倒谱参数等的提取。
   (3)在分析VQ基本原理、LBG算法和VQ码本初始化的基础上,设计实现了基于VQ的说话人识别系统,完成了模型参数训练和匹配识别过程,实验分析了不同模型参数及不同语音样本时长下的系统识别性能。
   (4)为了提高系统识别率和稳定性,在研究GMM模型参数估计期望最大化(EM)算法、模型参数初始化、训练和识别过程的基础上,研究设计了基于GMM的说话人识别系统,并完成了系统仿真实验,分析了不同模型参数、不同特征提取方法、不同语音样本时长和不同信噪比噪声环境下的说话人识别性能。
   (5)分析了开集说话人识别方法、说话人确认阈值选取方法,研究了一种先辨认后确认的开集说话人识别方法,分析了针对集外冒充说话人的“拒识问题”,并完成了基于VQ和GMM两种模型的开集说话人识别系统性能分析比较。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号