首页> 中文学位 >语音非线性特征在说话人识别中的应用
【6h】

语音非线性特征在说话人识别中的应用

代理获取

目录

文摘

英文文摘

原创性声明及本论文使用授权说明

第一章绪论

1.1说话人识别的概念和研究意义

1.1.1说话人识别的概念

1.1.2说话人识别的研究意义

1.2说话人识别的技术难点

1.3说话人识别的研究历史和现状

1.2.1研究历史

1.2.2国内外研究现状

1.4语音信号非线性处理

1.5说话人识别的数据库

1.6本文的主要内容

第二章语音非线性本质

2.1非线性理论概述

2.1.1混沌与分形的概述

2.1.2非线性分析方法

2.2语音的非线性现象

2.2.1发音器官和发音过程

2.2.2语音生成过程的非线性

2.3语音混沌性的验证

2.3.1相空间重构

2.3.2李雅普诺夫指数

2.4实验结果和分析

2.4.1重构语音信号相空间

2.4.2最大李雅普诺夫指数

2.5本章小结

第三章说话人特征参数

3.1语音信号预处理

3.2语音特征的选择原则

3.3说话人识别常用特征提取

3.3.1线性预测系数(LPC)及其倒谱系数(LPCC)

3.3.2 Mel频率倒谱系数(MFCC)

3.4语音非线性特征提取

3.4.1分形维数

3.4.2二阶动态熵

3.4非线性特征参数分析-关系和F比

3.5本章小结

第四章说话人识别模型

4.1高斯混合模型

4.1.1模型描述

4.1.2模型参数的估计

4.2矢量量化模型

4.2.1距离测度和码本生成

4.2.2初始码字的设置和空胞腔的处理

4.3说话人辨认实验及结果分析

4.3.1混合高斯模型基准系统

4.3.2矢量量化模型基准系统

4.4本章小结

第五章说话人常用特征与非线性特征融合

5.1信息融合原理

5.1.1信息融合的分类

5.1.2多分类器融合的类型

5.1.3多分类器融合的方法

5.2基于特征层融合的说话人辨认

5.2.1构建高维矢量法的融合实现

5.2.2构建复数矢量法的融合实现

5.3基于决策层融合的说话人辨认

5.3.1串联形式的说话人辨认实验及分析

5.3.2并联形式的说话人辨认实验及分析

5.4本章小结

第六章总结和展望

参考文献

攻读硕士学位期间发表的论文

致谢

展开▼

摘要

说话人识别是一种生物识别技术,它是指机器通过说话人的语音自动识别出说话人的身份。在信息接入服务安全控制、司法鉴定、人机界面智能化等方面这项技术有着良好的应用前景。说话人识别主要经过三个阶段来实现——提取特征、建立说话人模型、判决。特征提取阶段是第一步,也是非常重要的一步。不能提取充分反映说话人个性特征的特征量,后两步的优化很难奏效。现有特征提取方法大都是建立把语音信号当作短时平稳信号的认识基础上的,这些特征用于说话人识别取得了较好的效果,但是在人们设法进一步提高系统的识别率和鲁棒性时呈现出了它的局限性。针对这种困难,本文考察了语音信号的非线性特征,并讨论如何将它们应用于说话人识别,以改善系统的性能。围绕这个研究思路,本文主要做了以下内容的工作: (1)介绍了说话人识别的基本概念、基本原理、技术难点,回顾了说话人识别的研究历史和概括了国内外的研究现状; (2)为从根源上研究语音特性,本文对语音的发声器官和产生机理进行描述,分析了说话人发音过程中存在的非线性现象,并通过计算38个汉语音素的最大李雅普诺夫指数从实验角度验证了语音的混沌性; (3)运用信号处理知识阐述线性预测倒谱系数、Mel倒谱系数等反映说话人个性的常用特征量的原理及计算方法。同时,较为详细地讨论了刻画语音非线性特性信息的特征量——最大李雅普诺夫指数、二阶熵和关联维数的物理意义及其提取算法; (4)比较新颖地将非线性特征运用于说话人识别。为检验其效果,使用矢量量化模型和高斯混合模型两种分类器,结合常用特征构建了两个基准系统,并且提供了有关基准系统性能的实验数据。 (5)如何运用信息融合的原理融合不同特征量和不同分类器的优势来提高说话人识别的性能,本文在最后部分进行了探讨和分析。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号