基于轨线模型和VQ模型的说话人识别研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

该论文主要的研究内容是基于轨线模型和VQ模型的说话人识别.说话人识别是根据人的声音来识别人的一种生物认证技术,其以独特的方便性、经济性和准确性等优势受到世人瞩目.轨线模型是近年来在语音识别中提出的新模型,它可以充分的挖掘连续语音帧之间的时序相关性;VQ模型是一个用语音信号特征的分布中心描述说话人的个性特征而没有描述语音信号特征时序时的模型.文章把轨线模型应用于说话人识别,同时对VQ模型的电码本训练算法进行了改进.作者对说话人识别系统的多个方面进行了研究,包括特征提取、建模、模式匹配和决策.在这些工作的基础上,做了下列几个方面的改进和研究:1.段模型:连续语音帧之间的时序相关性往往包含了反应说话人个性的信息,目前主流特征只考虑到语音帧内(IntraFrame)的关系,而没有考虑到语音帧之间(InterFrame)的关系.语音信号本质上具有连续性,所以获取语音帧特征之间的时变特性,将对识别的性能带来提高.段模型的特性可以帮助我们获取语音帧间的信息.2.参数化随机轨线模型:在说话人识别系统中,经常存在训练语料不足的问题.这种情况下仍然用GMM或者HMM进行文本无关的说话人识别,其效果很差.此时,文本相关的说话人识别是一个很好的选择.参数化随机轨线模型具有很强的挖掘连续语音帧之间的时序性的能力,实现其在文本相关的说话人识别中的应用,效果要好于GMM和HMM.3.基于聚类有效性分析的VQ模型:VQ模型电码本的训练算法有一个弱点:电码本大小是人为指定的.该文借助聚类有效性分析,对常用的电码本训练算法进行了改进,其主要目的就是实现电码本大小的自动设定并提高说话人识别性能.

著录项

作者
俞成功;
展开▼
作者单位

浙江大学;

展开▼
授予单位浙江大学;
学科计算机应用
授予学位硕士
导师姓名吴朝晖,杨莹春;
年度 2004
页码
总页数
原文格式 PDF
正文语种中文
中图分类模式识别与装置;语音信号处理;
关键词
说话人识别; 轨线模型; 段模型; 参数化随机轨线模型; 时序性; 相关性; 时序相关性; VQ模型; 聚类; 聚类有效性分析;

相似文献

中文文献
外文文献
专利

1. 基于VQ的说话人识别技术研究 [J] . 檀蕊莲 . 信息技术 . 2010,第008期
2. 改进的基于VQ+WNN的说话人识别研究 [J] . 张鹏 ,王成儒 . 无线电通信技术 . 2008,第004期
3. 基于VQ反模仿说话人识别再确认系统算法研究 [J] . 周鸣 ,景新幸 . 大众科技 . 2008,第003期
4. 基于改进后的VQ说话人识别系统研究 [J] . 罗利 ,张友纯 . 软件导刊 . 2008,第12期
5. 基于VQ的与文本相关说话人识别研究 [J] . 龚伟 ,汪鲁才 . 电声技术 . 2006,第004期
6. 基于三维效益的现代有轨电车示范线双层决策模型及其应用研究 [C] . 刘福华 ,刘汶菠 ,刘爽阳 . 综合轨道交通工程建设与城市化协同发展学术交流会 . 2014
7. 基于矢量量化（VQ）和混合高斯模型（GMM）的说话人识别的研究 [A] . 许百林 . 2005

基于轨线模型和VQ模型的说话人识别研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅