首页> 中文学位 >基于DTED-FTRLS和BP神经网络的说话人识别研究
【6h】

基于DTED-FTRLS和BP神经网络的说话人识别研究

代理获取

目录

声明

摘要

第一章 绪论

1.1 说话人识别技术

1.1.1 说话人识别的研究背景及其意义

1.1.2 说话人识别的历史及现状

1.2 说话人识别概述

1.2.1 说话人识别的概念及分类

1.2.2 说话入识别系统框图

1.3 论文的组织结构

1.3.1 研究工作

1.3.2 内容安排

第二章 语音信号的数字化处理

2.1 语音信号的获取

2.1.1 语音信号产生的原理

2.1.2 语音信号的采集及数字化

2.2 语音信号的预处理介绍

2.2.1 语音信号的预加重处理

2.2.2 分帧与加窗

2.2.3 语音信号的短时平均能量

2.2.4 语音信号的短时平均过零率

2.3 说话人语音信号特征参数的提取

2.3.1 梅尔频率(Mel-Frequency Analysis,Mel)的分析

2.3.2 MFCC的提取流程

2.4 本章小结

第三章 语音信号端点检测及滤波处理

3.1 语音信号的端点检测

3.1.1 传统的DTED技术及仿真分析

3.1.2 改进DTED技术及仿真分析

3.1.3 改进的端点检测算法结合矢量量化进行说话人识别应用

3.2 语音信号的滤波处理

3.2.1 LMS滤波算法

3.2.2 RLS滤波算法

3.2.3 FTRLS滤波算法

3.2.4 改进FTRLS滤波算法

3.2.5 结果对比分析

3.3 本章小结

第四章 基于人工神经网络的说话人识别

4.1 神经网络发展历史

4.1.1 神经网络的研究背景

4.1.2 神经网络的优势

4.2 人工神经网络的原理

4.2.1 人工神经网络的基本概念

4.2.2 神经元结构

4.2.3 神经网络结构

4.2.4 神经网络的学习方式和规则

4.3 BP神经网络

4.3.1 前向传播

4.3.2 反向传播

4.4 本章小结

第五章 说话人识别系统的仿真实验

5.1 实验的前提条件

5.1.1 实验的软硬件环境及语音信号采集

5.1.2 说话人识别系统识别率的计算

5.2 仿真实验

5.2.1 不同语音长度

5.2.2 不同特征维度

5.2.3 不同迭代次数

5.2.4 待识别说话人个数

5.3 本章小结

6.1 总结

6.2 展望

参考文献

致谢

攻读硕士学位期间发表的论文

展开▼

摘要

说话人识别,为生物识别的一种,它主要依据说话人语音中表征的个性特征,作为特征参数,从而利用各种模型方法,如动态时间规整(DTW)、矢量量化(VQ)、隐马尔可夫模型(HMM)、高斯混合模型(GMM)及人工神经网络(ANN)等等,进行识别的技术。
  本文是基于改进双门限端点检测、FTRLS滤波算法和BP神经网络进行的与文本无关的说话人辨认系统,其主要研究如下:
  (1)改进的双门限端点检测方法。文中首先介绍了两种传统双门限端点检测的算法步骤,并通过实验证实,第一种端点检测方案存在音节漏检,原因可能是由于静音或停顿时间过长,被误认为是检测结束;第二种端点检测方案受突发噪声的影响颇为严重。为了同时避免这两种传统端点检测方案存在的缺陷,本文提出了一种改进的双门限端检测方法,对比改进前后实验结果可以看出,改进后的端点检测方法将语音进行逐音节检测,并去除音节间隔静音部分,同时排除了一定突发噪声的干扰,大幅度地提高了说话人系统的识别效果。
  (2)提出了一种改进的FTRLS滤波算法,即找出计算误差大的量并累计,再将该误差进行反馈从而使算法更加稳定。仿真结果分析表明,改进算法提高了收敛速度和稳定性,并有效地减小了收敛后的噪声。
  (3)利用三层BP神经网络进行说话人识别。本文中BP网络输入层为24或36个神经元,隐含层为25个神经元,输出层神经元个数最大值为10个,并对四种激活函数Sigmoid函数、Tanh函数、ReLu函数及Leaky ReLu函数进行分析,最终与改进的端点检测和FTRLS算法结合起来进行说话人识别。实验证明,改进的算法将说话人识别率提高了约5%,而且降低了计算复杂度,增加了系统稳定性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号