首页> 中文学位 >基于线谱对系数和高斯混合模型的说话人识别技术研究
【6h】

基于线谱对系数和高斯混合模型的说话人识别技术研究

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1研究意义

1.2研究现状及分析

1.2.1说话人识别研究现状

1.2.2说话人识别的分类

1.2.3说话人识别的特征参数

1.2.4说话人识别模型

1.3说话人识别的难点

1.4论文工作及组织结构

第二章说话人识别理论基础

2.1引言

2.2语音物理基础

2.3说话人识别系统

2.4说话人识别的特征参数

2.4.1线性预测系数

2.4.2语音共振峰

2.4.3倒谱系数

2.4.4线性预测倒谱系数

2.4.5梅尔倒谱系数

2.4.6特征评价方法

2.5说话人识别的识别模型

2.5.1 k-平均聚类算法

2.5.2高斯混合模型

第三章说话人语音的预处理

3.1基于小波变换的语音去噪方法

3.1.1小波分析理论基础

3.1.2小波去噪

3.2自适应双门限端点检测

3.2.1短时能量、短时过零率和能频值

3.2.2自适应双门限端点检测法

第四章基于线谱对系数和高斯混合模型的说话人识别

4.1基于线谱对系数的说话人特征

4.1.1线谱对系数

4.1.2LSP算法分析

4.1.3线谱对系数特征

4.2基于高斯混合模型的说话人识别模型

4.2.1高斯混合模型的EM实现

4.2.2 EM算法的K-均值法初始化

第五章说话人识别系统的实现与性能测试

5.1实验环境及语音库

5.2语音预处理

5.2.1语音去噪

5.2.2语音端点检测

5.3 LSP-GMM说话人识别系统综合性能

第六章结论与展望

参考文献

致谢

攻读学位期间主要的研究成果

展开▼

摘要

随着信息技术的发展和对信息安全的日益迫切需求,基于生物特征的个人身份识别技术也得到了飞速发展。说话人识别是生物识别的一个分支,随着近年来现代电子技术的高速发展,正以其独特的方便性、经济性和准确性等优势受到世人瞩目,是当前安全认证系统研究和发展的必然趋势。本文对小规模文本无关说话人识别的理论和技术进行了系统的研究。针对清浊音的不同特性采用多尺度分段小波去噪,较完整的保留了语音的频谱特性。使用自适应双门限法进行端点检测,能根据不同的语音环境做自适应变化,提高了端点检测性能。线谱对LSP(Linear Spectrum Pairs)系数具有良好的动态范围和滤波稳定性,以及良好的内插特性和量化特性,并能良好的表征说话人语音中的共振峰信息,能更好地提取语音信号中隐含的音谱特征,本文分析了其频谱特性,并与现有的主要说话人特征进行了性能分析和比较,证明LSP参数具有良好的说话人特征提取性能。同时针对GMM模型的EM算法使用k-Means聚类法进行了优化,提高了系统训练模型的性能。本文将LSP系数和GMM模型相结合建立了文本无关说话人识别系统,实验表明,该系统具有良好的性能和实用性,当信噪比为20dB至40dB时,识别率可达90%以上。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号