首页> 中文学位 >基于SVM的与文本无关的说话人识别系统研究
【6h】

基于SVM的与文本无关的说话人识别系统研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

§1.1 研究背景与意义

§1.2 说话人识别发展史

§1.3 论文的主要工作

第二章 说话人识别系统

§2.1 说话人识别概述

§2.2 语音声学模型

§2.3 识别系统框架

§2.4 特征参数

§2.5 识别模型

§2.6 系统性能评估

§2.7 本章小结

第三章 语音预处理

§3.1 小波分析

§3.2 改进的半软阈值降噪

§3.3 端点检测

§3.4 Mel频率倒谱系数

§3.5 本章小结

第四章 识别系统

§4.1 统计学习理论

§4.2 支持向量机

§4.3 改进的FCM聚类

§4.4 高斯混合模型

§4.5 系统仿真与分析

§4.6 本章小结

第五章 总结与展望

参考文献

作者在攻读硕士期间的主要研究成果

致谢

展开▼

摘要

说话人识别技术属于生物认证技术的范畴,主要依据说话人语音波形中表征说话人生理、行为的特征参数来自动辨识说话人的身份,具有广阔的应用前景。目前,说话人识别技术趋于成熟,实验室环境下的系统识别性能也达到较高水平,但是在噪声的识别环境下,识别系统的稳健性能仍较差,无法满足实用性要求。本文围绕识别系统实用化存在的问题进行研究,提出改进的半软阈值降噪算法以及改进的FCM算法来改善说话人识别系统性能。
  在识别系统前端部分,首先提出一种改进的半软阈值降噪算法,利用小波的多分辨率分析特性滤除说话人语音的噪声污染,还原尽可能纯净的原始语音,有效地改善了识别系统的稳健性。接着详细分析比较说话人语音的预处理技术,包括端点检测和特征参数提取。由于传统的基于短时平均幅度和短时平均过零率的端点检测,即双门限端点检测法在低噪声比环境下准确率较差,本文分析了基于谱熵和基于C0复杂度的两种端点检测方法,并通过实验仿真,基于谱熵和基于C0复杂度的端点检测方法在低噪声比下也能准确地检测出语音的始末点。
  在模式匹配部分,重点介绍了统计学习理论——支持向量机SVM,提出改进的FCM算法对SVM聚类,增强所选特征矢量的代表性;接着介绍了GMM理论及其统计特性,构建基于GMM-SVM的说话人识别系统,通过实验仿真分析改进的半软阈值降噪算法和改进的FCM算法对GMM-SVM识别系统性能的影响。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号