首页> 中文学位 >说话人识别中语音参数提取方法的研究
【6h】

说话人识别中语音参数提取方法的研究

代理获取

目录

声明

摘要

第1章 绪论

1.1 选题背景及意义

1.2 说话人识别参数及模型研究的现状和难点

1.3 研究内容与章节安排

第2章 语音信号预处理及说话人识别原理

2.1 语音信号产生模型

2.1.1 激励模型

2.2.2 声道模型

2.2.3 辐射模型

2.2 语音信号前端处理

2.2.1 语音信号采集及数字化

2.2.2 预加重

2.2.4 分帧及加窗

2.3 说话人识别原理

2.3.1 说话人识别的分类

2.3.2 说话人识别的实现过程

2.4 说话人识别的模型

2.4.1 矢量量化VQ模型

2.4.2 隐马尔可夫模型(HMM)模型

2.4.3 高斯混合模型(GMM)模型

2.5 本章小结

第3章 说话人识别中特征参数的提取方法

3.1 说话人识别常用特征概述

3.2 基音周期

3.3 线性预测系数

3.2.1 线性预测中LPC分析

3.2.2 线性预测倒谱系数的提取

3.3 梅尔倒谱系数

3.4 感知线性预测倒谱系数

3.5 说话人识别实验分析

3.5.1 单特征说话人识别实验及对比

3.5.2 组合基音周期的实验

3.6 本章总结

第4章 改进的基于基音同步的特征参数

4.1 基音同步原理

4.1.1 传统加窗的缺陷

4.1.2 基于基音同步可变窗长加窗

4.2 基于基音同步的特征参数提取

4.2.1 基于基音同步的MFCC参数

4.2.2 基于基音同步的LPCC参数

4.2.3 基于基音同步的PLPCC参数

4.3 实验结果与分析

4.4 本章总结

第5章 基于浊音谱重建的特征参数提取方法

5.1 清浊音频谱分析

5.2 频谱的重建的及特征参数提取

5.2.1 基函数为sinc函数的重建

5.3 混合特征参数

5.4 本章总结

第6章 总结与展望

科研及获奖情况

致谢

参考文献

展开▼

摘要

说话人识别属于生物特征识别的一种,也称为声纹识别。说话人识别在人的身份识别领域具有广泛的研究价值和应用前景。说话人识别中反映人的个性的特征参数的提取是影响识别结果的一个关键问题。本文主要研究各种语音特征参数以及其改进的参数应用于说话人识别。
  文中对于说话人识别中的三种基本特征参数,MFCC、LPCC和PLPCC分别研究了其提取过程,将这三种参数分别应用于已经搭建好的说话人识别平台。本文说话人识别模型用的是在与文本无关的语音识别中常用的GMM模型。文中完成了三种参数分别用于说话人识别的实验,分析了其实验结果。并且将基音周期这种反映说话人声带的固有特征的参数分别与三种参数组合,完成实验结果的分析。针对以上实验结果中噪声情况下,特别低信噪比下识别率明显下降,如0db高斯白噪声下都低于10%。文中提出了两种改进的参数提取方法:基于基音同步预处理的参数提取与基于浊音谱重建的参数提取。基音同步主要是根据基音周期的长度实现对语音信号的可变窗长的加窗,可以补偿浊音在非周期长度被截断导致的频谱泄露,提取的参数会使高频段的参数更加的具有鲁棒性。浊音谱重建根据浊音谱的短时谱具有明显的谐波特性,且在噪声环境下谐波特性不会发生明显的改变,基于此可以对含噪浊音谱进行重建,使重建后的频谱接近真实的纯净语音谱,再将经过谱重建后提取的参数应用于说话人识别。实验结果都表明以上两种改进可以明显提高说话人识别系统的识别率,尤特别是在低信噪比环境下的识别率会有明显的提高,如0db的高斯白噪声下识别率提高都在15%到20%左右。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号