文摘
英文文摘
东南大学学位论文独创性声明及使用授权声明
第一章绪论
1.1引言
1.2说话人识别的基本概念及其分类
1.3说话人识别的基本原理
1.4说话人识别的发展和现状
1.5论文内容安排
第二章语音信号的处理和特征矢量的分析及提取
2.1引言
2.2语音信号的产生原理
2.3语音信号的特征分析
2.4语音信号的时域分析
2.5线性预测编码(LPC)分析
2.6复倒谱和倒谱
2.7 MEL倒谱参数(Mel-Frequency Cepstral Coefficients:MFCC)
2.8特征参数的评价方法
2.9本章小结
第三章说话人识别系统的识别方法
3.1引言
3.2矢量量化方法(Vector Quantization)
3.2.1矢量量化的原理
3.2.2矢量量化器的最佳码本设计
3.2.3矢量量化的LBG算法
3.2.4初始码本的设置及畸变准则的选择
3.3模糊矢量量化(Fuzzy Vector Quantization)
3.4改进的FCM模糊聚类算法(Improve Algorithms of Fuzzy C-mean Clustring)
3.5遗传算法的基本原理[21]
3.6 GAVQ算法[22]
3.6.1基因编码
3.6.2适应度函数选择
3.6.3初始码本的形成
3.6.4遗传操作
3.6.5迭代停止条件
3.6.6算法收敛性讨论
3.7本章小结
第四章人工神经网络在说话人识别中的应用
4.1引言
4.2人工神经网络简介
4.3一种时间规整算法及其在神经网络说话人识别中的应用
4.4多层感知器
4.5径向基函数的组合神经网络
4.5.1径向基函数神经网络(RBF)
4.5.2子网的训练
4.5.3说话人识别网络模型
4.6本章小结
第五章系统实现与实验结果
5.1引言
5.2语音库的建立及语音信号的预处理
5.2.1录音
5.2.2语音库构成
5.2.3数据采集
5.2.4语音信号的预处理
5.3应用矢量量化(VQ)的说话人识别
5.3.1应用VQ的说话人识别过程
5.3.2模糊矢量量化(Fuzzy VQ)的识别
5.3.3 GAVQ的识别
5.3.4 GAVQ与VQ的实验结果说明
5.4应用人工神经网络(ANN)的说话人识别
5.4.1基于MLP的的BP算法的实验与结果
5.4.2基于径向基函数的实验与结果
5.5本章小结
结 论
致 谢
参考文献
研究生期间发表的论文