语音非线性特征在说话人识别中的应用

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

说话人识别是一种生物识别技术，它是指机器通过说话人的语音自动识别出说话人的身份。在信息接入服务安全控制、司法鉴定、人机界面智能化等方面这项技术有着良好的应用前景。说话人识别主要经过三个阶段来实现——提取特征、建立说话人模型、判决。特征提取阶段是第一步，也是非常重要的一步。不能提取充分反映说话人个性特征的特征量，后两步的优化很难奏效。现有特征提取方法大都是建立把语音信号当作短时平稳信号的认识基础上的，这些特征用于说话人识别取得了较好的效果，但是在人们设法进一步提高系统的识别率和鲁棒性时呈现出了它的局限性。针对这种困难，本文考察了语音信号的非线性特征，并讨论如何将它们应用于说话人识别，以改善系统的性能。围绕这个研究思路，本文主要做了以下内容的工作： (1)介绍了说话人识别的基本概念、基本原理、技术难点，回顾了说话人识别的研究历史和概括了国内外的研究现状； (2)为从根源上研究语音特性，本文对语音的发声器官和产生机理进行描述，分析了说话人发音过程中存在的非线性现象，并通过计算38个汉语音素的最大李雅普诺夫指数从实验角度验证了语音的混沌性； (3)运用信号处理知识阐述线性预测倒谱系数、Mel倒谱系数等反映说话人个性的常用特征量的原理及计算方法。同时，较为详细地讨论了刻画语音非线性特性信息的特征量——最大李雅普诺夫指数、二阶熵和关联维数的物理意义及其提取算法； (4)比较新颖地将非线性特征运用于说话人识别。为检验其效果，使用矢量量化模型和高斯混合模型两种分类器，结合常用特征构建了两个基准系统，并且提供了有关基准系统性能的实验数据。 (5)如何运用信息融合的原理融合不同特征量和不同分类器的优势来提高说话人识别的性能，本文在最后部分进行了探讨和分析。

著录项

作者
邓德春;
展开▼
作者单位

上海大学;

展开▼
授予单位上海大学;
学科通信与信息系统
授予学位硕士
导师姓名侯丽敏;
年度 2005
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音识别与设备;
关键词
说话人识别; 非线性特征; 李雅普诺夫指数; 熵; 分形维数; 信息融合; 生物识别;

相似文献

中文文献
外文文献
专利

1. 双微阵列语音增强算法在说话人识别中的应用 [J] . 毛维 ,曾庆宁 ,龙超 . 声学技术 . 2018,第3期
2. 基于HHT的语音特征参数提取及其在说话人识别中的应用 [J] . 刘丽伟 ,张瑶 ,赵孔新 . 长春工业大学学报（自然科学版） . 2009,第006期
3. 小波语音增强算法在说话人识别中的应用 [J] . 王娜 ,郑德忠 ,刘海龙 . 控制工程 . 2007,第5期
4. 基于语音谐波结构的鲁棒特征参数及其在说话人识别中的应用 [J] . 张玲华 ,郑宝玉 ,杨震 . 电子与信息学报 . 2006,第010期
5. 语音特征参数在说话人识别中的应用 [J] . 张银娟 ,张玲华 ,朱国洋 . 金陵科技学院学报 . 2006,第001期
6. 新型汉语耳语音频率尺度在说话人识别中的应用 [C] . 林玮 . 2011中国西部声学学术交流会 . 2011
7. 清辅音特征分析及其在耳语音说话人识别中的应用 [A] . 徐娟 . 2013

语音非线性特征在说话人识别中的应用

目录

摘要

著录项

相似文献

相关主题

期刊订阅