基于矢量量化和高斯混合模型的说话人识别技术研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

说话人识别是生物识别的一个分支，正以其独特的方便性、经济性和准确性等优势受到世人瞩目，是当前安全认证系统研究和发展的必然趋势。本文就小规模文本无关说话人识别的理论和技术进行了系统的研究。分别在语音库建立、语音去噪、端点检测、特征提取及识别方法等5个方面取得了较有成效的进展。建立了一个基于说话人识别的小型语音库，完成了20个人的语音样本采集工作，为算法测试奠定了物质基础。针对基于软阈值的多尺度小波去噪方法对清音的功率谱破坏较大，不利于保持语音完整性的缺点，提出了分段小波去噪方法，较完整的保留了清音的功率谱，同时充分利用了基于软阈值的多尺度小波去噪方法的去噪能力。对分形维数在端点检测中的应用进行了研究，研究表明和短时能量、短时过零率相比，分形维数具有更好的鲁棒性，适用于低信噪比环境。比较和分析了现有说话人识别特征，表明梅尔倒谱系数在单独使用时优势明显，梅尔倒谱系数及其二阶差分系数的组合具有更好的区分能力。提出了一种基于语音频谱的准基音频率，该特征依赖于浊音的谱特性，和基音频率相比具有较好的抗噪声、抗长时变动的能力。在不改变空间复杂度，不明显增加时间复杂度的前提下，利用语音无精确类别的特性，将粗糙集引入矢量量化中，降低了噪声的干扰能力。利用各语音段被噪声干扰的程度不同，提出了一种自适应补偿的高斯混合模型法，在一定信噪比范围内提高了系统的识别性能。本文用MATLAB建立了文本无关说话人识别的实验平台，实验结果表明改进算法的整体性能要优于传统算法，其中采用分形端点检测，小波去噪，MFCC特征和基于粗糙集的矢量量化方法的性能较好，在20dB信噪比下，识别率可达到98.03％。

著录项

作者
陈妮;
展开▼
作者单位

中南大学;

展开▼
授予单位中南大学;
学科电路与系统
授予学位硕士
导师姓名盛利元;
年度 2008
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音识别与设备;
关键词
安全认证; 特征提取; 语音识别; 小波去噪; 语音频谱;

相似文献

中文文献
外文文献
专利

1. 基于矢量量化的说话人识别系统硬件实现 [J] . 何赞园 ,王凯 ,吉立新 . 现代电子技术 . 2022,第1期
2. 基于Sugeno测度的动态不可加双矢量量化说话人识别研究 [J] . 田景峰 ,赵振东 ,胡喜梅 . 华北电力大学学报(自然科学版) . 2010,第006期
3. 说话人识别中基于聚类特征的矢量量化技术 [J] . 徐利敏 ,唐振民 ,何可可 . 计算机工程与应用 . 2007,第027期
4. MATLAB环境下基于矢量量化的说话人识别系统 [J] . 宋敏 ,刘幺和 ,谭保华 . 湖北工业大学学报 . 2006,第006期
5. 基于遗传矢量量化和遗传神经网络的说话人识别系统 [J] . 白玉 ,陈立伟 . 应用科技 . 2005,第012期
6. 矢量量化与协方差矩阵结合的说话人识别方法 [C] . 龙川 ,景新幸 ,杨海燕 . 中国声学学会2010年全国会员代表大会暨学术会议 . 2010
7. 基于矢量量化的说话人识别技术研究 [A] . 黄文辉 . 2006

基于矢量量化和高斯混合模型的说话人识别技术研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅