首页> 中文学位 >基于矢量量化的说话人识别系统研究及实现
【6h】

基于矢量量化的说话人识别系统研究及实现

代理获取

目录

摘要

1 绪论

1.1 研究的背景及意义

1.2 说话人识别研究的历史和现状

1.3 说话人识别概述

1.3.1 基本概念

1.3.2 常规分类

1.3.3 基本原理

1.4 论文研究工作和内容安排

1.4.1 研究工作

1.4.2 内容安排

2 语音信号前期处理及特征提取

2.1 语音信号的预处理

2.1.1 预加重

2.1.2 加窗分帧

2.2 语音信号的端点检测

2.2.1 双门限法

2.2.2 谱减法

2.2.3 谱熵法

2.3 语音信号的特征提取

2.3.1 线性预测系数和线谱对系数

2.3.2 线性预测倒谱系数和梅尔频率倒谱系数

2.3.3 线性预测倒谱系数和梅尔频率倒谱系数的Delta特征

2.4 本章小结

3 说话人识别模板训练方法

3.1 矢量量化的原理

3.2 矢量量化的过程

3.3 LBG算法

3.4 本章小结

4 基于矢量量化的说话人识别系统设计

4.1 系统方案的选择

4.2 软件系统构成

4.3 系统功能模块设计

4.3.1 系统登录模块

4.3.2 语音库管理模块

4.3.3 语音采集模块

4.3.4 模式选择模块

4.3.5 前期处理模块与波形绘制模块

4.3.6 特征选择模块

4.3.7 训练识别模块与反馈信息模块

4.3.8 其他功能模块

4.4 本章小结

5.系统性能测试及结果分析

5.1 系统整体功能测试

5.2 实验结果与分析

5.2.1 特征参数及其阶数对识别结果的影响

5.2.2 训练模型码本大小对识别结果的影响

5.2.3 帧长和帧移对识别结果的影响

5.3 本章小结

6 总结和展望

6.1 总结

6.2 展望

参考文献

攻读硕士学位期间取得的研究成果

致谢

声明

展开▼

摘要

语音是最简便、人们使用最频繁的交流工具,也是我们获取信息的主要途径之一。说话人识别是利用语音信号对说话人身份进行识别的一门技术,是语音信号处理领域的一个重要分支,该技术在安全保障、公安司法等领域有着广泛应用。
  本文以矢量量化模板训练方法为基础,建立了一套说话人识别软件系统。主要工作有:
  (1)详细阐述了语音信号前期处理及特征提取的方法。研究了矩形窗和海明窗对语音信号分析的影响,比较了双门限法、谱减法和谱熵法三种端点检测的方法,介绍了LPC、LSP、LPCC、MFCC、△LPCC和△MFCC六种特征参数的提取方法,并详细阐述了矢量量化的基本原理、过程和算法。
  (2)以Matlab GUI、M语言和编译器为工具,搭建了说话人识别软件系统。在系统前端,设置了登录和语音库管理模块,给用户提供了安全、简便的使用环境。在系统的主界面,设置了模式选择模块和说话人识别的各步骤模块,后者包含了之前理论部分的所有方法,体现出的特色是:可选择方案种类多、可自行设置参数值、单个人的识别和多人识别都可进行、操作简单、效果直观。在主界面中,还设置了反馈信息模块、语音的时域、变换域分析等其他功能模块,扩大了系统的使用范围,增加了其灵活性。
  (3)以搭建的软件系统为平台,进行系统测试和实验分析。测试表明:系统各模块相互协调良好、能够顺利完成识别的任务;进行的三项实验分别是特征参数及其阶数、训练模型码本大小以及帧长和帧移大小对识别结果的影响,实验表明:在本实验条件下,14阶的△MFCC特征参数,在训练模型码本大小为128、语音信号分帧的帧长和帧移为440和220时,识别效果最优。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号