首页> 中文学位 >基于HHT-IF与MFCC混合参数的说话人识别系统的研究
【6h】

基于HHT-IF与MFCC混合参数的说话人识别系统的研究

代理获取

目录

第一章 绪论

§1.1 研究背景

§1.2 说话人识别技术的发展

§1.3 说话人识别的应用前景

§1.4 说话人识别技术的难点

§1.5 论文的研究工作与安排

第二章 说话人识别系统概述

§2.1 说话人识别的基本概念

§2.2 语音信号处理

§2.3 语音信号特征提取

§2.4 说话人识别模型

§2.5 本章小结

第三章 语音信号前端处理

§3.1 语音信号预处理

§3.2 传统语音端点检测方法

§3.3 改进的双门限端点检测法

§3.4 实验结果分析

§3.5 本章小结

第四章 特征参数的提取

§4.1 LPCC参数提取

§4.2 MFCC参数提取

§4.3 MFCC参数的二次特征提取

§4.4 一种新型的混合特征参数

§4.5 本章小结

第五章 基于SVM的说话人识别研究

§5.1 支持向量机

§5.2 实验结果及分析

§5.3 本章小结

第六章 总结与展望

§6.1 工作总结

§6.2 展望

参考文献

致谢

攻读硕士期间发表的论文

参与的科研项目

展开▼

摘要

说话人识别,也被称为声纹识别,是从说话人语音中提取特征参数,利用这些特征参数建立模型,然后使用某种识别算法进行识别的一种身份鉴别和认证技术。随着互联网的快速发展以及人们对高效、便捷生活方式的不断追求,人们经常使用电子商务、电子金融、呼叫查询等自助服务。因此,在开展这些业务之前对个人的身份进行认证是保证数据传输安全以及不遭受黑客的侵袭而导致信息丢失的基础。对个人身份进行说话人识别,尤其是与文本无关的说话人识别的研究也将具有重要的实践价值而被大众越来越多的关注。
  说话人识别技术虽然已经有了长时间的发展与进步,也取得了许多骄人的成绩,但仍有很多的问题有待我们解决。尤其是在平常的应用中,由于受到噪声的影响,从而削弱其性能。本文提出一种将支持向量机作为识别模型的声纹识别系统,从识别系统的整体框架入手,改进了声纹系统中端点检测、特征参数提取以及建立识别模型等环节。主要内容如下:
  首先,针对噪声环境下,识别精度会有所降低的问题,本文的端点检测方法是将过零率与加权改进的谱熵法相结合的门限法,加权谱熵即先计算出每帧信号的谱熵值,并进行加权处理,使语音信号的动态特性更为明显的表现出来,然后将该方法与传统的双门限法与谱熵法进行不同环境下的对比实验,实验结果验证了这种改进的双门限法在性能与实用性上都得到了提高。
  其次,因为MFCC、 MFCC与WMFCC各自从不同的角度描述了语音信号的特征,所以在特征提取阶段,利用增减分量法计算出这三类参数各自分量的贡献,选取它们贡献最大的分量混合,然后用HHT算法计算出语音信号各IMF分量的瞬时频率HHT-IF与以上混合参数再次融合,最后得到一种新型特征参数。该参数克服了传统特征参数的一些不足。
  再次,本文说话人识别模型选用SVM模型,首先介绍了SVM的基本原理,并对算法中核函数的选取进行了实验对比,结果表明,本文实验中选择了径向基函数效果最好。然后将本文提出的端点检测与特征参数对整个系统进行改进并进行实验。实验表明识别率与鲁棒性都有所改善。
  最后,对本文的所有工作进行了概括总结,初步计划接下来的研究方向。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号