首页> 中文学位 >基于高斯混合模型的说话人识别系统的研究
【6h】

基于高斯混合模型的说话人识别系统的研究

代理获取

目录

文摘

英文文摘

1绪论

1.1研究的背景及意义

1.1.1研究的现实意义

1.1.2主要的应用领域

1.2研究的历史与现状

1.2.1研究的历史

1.2.2研究的现状

1.2.3研究的难点

1.3说话人识别基本介绍

1.3.1说话人识别的基本原理

1.3.2说话人识别的几种类别

1.3.3说话人识别常用的特征

1.3.4说话人识别主要的分类方法

1.3.5说话人识别系统的性能评价

1.4本文的结构安排

2语音信号的分析与预处理

2.1语音产生的机理

2.1.1人体发声机理

2.1.2语音发声基础

2.2语音信号的数字模型

2.3语音信号的预处理

2.3.1采样与量化

2.3.2预加重处理

2.3.3分帧后加窗

2.3.4特征提取及评价

2.4相关的分析方法

2.4.1时域分析

2.4.2倒谱分析

2.4.3线性预测分析

3 说话人识别的特征提取

3.1基音周期估计

3.1.1基音周期的基本含义

3.1.2基音周期的检测方法

3.1.3基音周期的提取步骤

3.2 LPC倒谱系数(LPCC)

3.2.1 LPCC的定义

3.2.2 LPCC的提取

3.2.3 LPCC的分析

3.3 Mel倒谱系数(MFCC)

3.3.1 MFCC的定义

3.3.2 MFCC的提取

3.3.3 MFCC的分析

3.4其他倒谱系数

3.4.1长时倒谱特征

3.4.2过渡倒谱特征

3.5其他特征

3.5.1共振峰频率

3.5.2短时平均过零率

3.5.3明亮度

3.5.4 Delta特征

4高斯混合模型在说话人识别中的应用

4.1高斯混合模型的基本概念

4.1.1高斯混合模型的含义

4.1.2高斯混合模型的描述

4.1.3高斯混合模型的训练

4.2 EM算法

4.2.1 EM算法的含义

4.2.2 EM算法的原理

4.2.3用EM算法估计GMM的参数

4.3 GMM参数的初始化

4.3.1常用方法简述

4.3.2 LBG算法

4.3.3 K-均值算法

4.4基于高斯混合模型的说话人识别

4.4.1 GMM应用于说话人识别系统

4.4.2系统判别准则

4.4.3实际应用问题

5系统实现与实验结果

5.1实验条件

5.1.1软硬件条件

5.1.2实验语音库

5.1.3识别率计算

5.2基于高斯混合模型的说话人识别系统的性能研究

5.2.1测试语音单位长度对识别结果的影响

5.2.2不同主流基本特征对识别结果的影响

5.2.3高斯混合模型阶数对识别结果的影响

5.2.4混合模型协方差阈值对识别结果的影响

5.2.5预加重系数对识别结果的影响

5.2.6帧长对识别结果的影响

5.3基于改进特征参数的说话人识别系统的研究

5.3.1一种基于特征加权的说话人识别算法

5.3.2一种基于特征差分的说话人识别算法

5.4基于改进最大期望算法的说话人识别系统的研究

5.4.1改进最大期望算法

5.4.2实验结果及其分析

5.5基于改进统计方法的说话人识别系统的研究

5.5.1识别统计方法改进

5.5.2实验结果及其分析

结 论

参考文献

攻读硕士学位期间发表学术论文情况

致 谢

展开▼

摘要

说话人识别技术属于生物认证技术的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数来自动识别说话人身份的技术。在生物认证技术领域中,说话人识别技术以其独特的方便性、经济性和准确性等优势受到世人关注。 本文的工作是围绕基于高斯混合模型的说话人识别系统展开研究,在完成多项基本性能的测试和比较的基础上,对特征提取、分类算法、识别统计中的某些环节进行一定的改进,以便获得较高的识别率。本文的工作主要有以下几个方面: (1)系统构建:在给出语音分段和识别率计算原则的基础上,首先研究了不同测试语音单位长度对识别率的影响情况,证明了这些原则的正确性和系统的可靠性;针对预处理过程中的预加重系数和加窗分帧帧长的选择进行实验,取得了预加重系数的最优值,以及在不同高斯混合模型阶数条件下的最佳帧长。 (2)性能研究:在相同的测试条件下,研究了LPC、LPCC、MFCC这些主流基本特征的优劣,证明了MFCC这种充分模仿人耳听觉特性的特征对提高识别率的作用;在相同的测试条件下,研究了高斯混合模型的阶数对系统识别率的影响,分析了阶数过大或过小对系统的负面影响,并结合实际情况进行了选择;提出在EM算法的迭代过程中设置协方差阈值,并对不同阈值条件下的识别率进行实验对比,证明了将协方差阈值设置为0.10的普适性和可行性。 (3)系统改进:对较为可靠的基本特征MFCC进行改进,引入差分倒谱概念并对改进前后的特征进行实验,证明了这种综合考虑前后帧影响的差分特征的有效性;考虑到传统最大期望算法存在着会出现奇异阵的缺陷,引入参数α来控制修正比例对迭代结果进行修正,验证了改进算法在参数估计上的有效性;针对系统判别准则中常用的传统概率打分法,采用归一化投票和设置比例阈值的方法改进,验证了归一化改进的局限性和比例阈值改进的有效性。 最后对本文工作进行了总结,同时对未来的研究工作进行了展望。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号