文摘
英文文摘
声明
第一章绪论
1.1引言
1.2研究背景与意义
1.3说话人识别的发展概况及现状
1.4说话人识别系统概述
1.4.1说话人识别的分类和基本组成
1.4.2说话人识别的特征提取
1.4.3说话人识别的主要方法
1.4.4说话人识别系统的性能评价
1.5研究现状和难点
1.5.1说话人特征的提取
1.5.2鲁棒性说话人识别技术
1.6论文主要研究内容与结构安排
1.6.1主要研究内容
1.6.2论文的结构安排
第二章基于特征变换和模糊LS-SVM的说话人辨认
2.1引言
2.2基本理论概述
2.2.1高斯混合模型原理
2.2.2 Mel频率倒谱参数特征
2.2.3最小二乘支持向量机
2.3基于特征变换和模糊LS-SVM的说话人辨认
2.3.1基于高斯混合模型的特征变换
2.3.2模糊隶属度函数
2.4说话人辨认实验
2.4.1实验语音库
2.4.2特征变换类数M对识别性能的影响
2.4.3不同的变换方法及其模糊隶属度对识别性能的影响
2.4.4与传统识别方法的性能比较
2.5结论
第三章基于感知特征和模型补偿的鲁棒性说话人辨认
3.1引言
3.2感知对数面积比系数
3.2.1线性预测模型
3.2.2人耳感知特性
3.2.3感知线性预测模型
3.2.4感知对数面积比系数的提取
3.3基于感知特征和模型补偿的说话人辨认算法
3.3.1对帧似然概率的归一化补偿变换
3.3.2基于感知特征和模型补偿的算法的提出
3.4鲁棒说话人辨认实验
3.4.1预处理和特征提取
3.4.2高斯混合模型的建立与识别
3.5实验与结果分析
3.5.1特征分量的F比鉴别分析
3.5.2噪声环境下基于高斯混合模型的辨认性能
3.5.3模型补偿变换参数的选择
3.5.4噪声环境下基于模型补偿的辨认性能
3.6结论
第四章基于自适应频率规整的鲁棒性说话人辨认
4.1引言
4.2语音发音系统原理
4.3说话人个性特征的提取
4.4自适应频率规整与特征提取
4.4.1频带鉴别性分析
4.4.2基于自适应频率规整的非均匀子带分布
4.4.3 DFCC参数的提取
4.5噪声环境下语音频谱的增强
4.5.1语音/非语音检测
4.5.2噪声谱估计
4.5.3先验信噪比的最优估计
4.5.4干净语音频谱的估计
4.6鲁棒说话人辨认实验
4.6.1不同语音文件的频带鉴别性分析
4.6.2干净语音环境下DFCC特征在不同测试文件的识别性能
4.6.3噪声环境下DFCC特征的抗噪性能测试
4.7结论
第五章基于汉语元音映射的说话人辨认
5.1引言
5.2汉语语音的基本特性
5.2.1汉语语音的特点
5.2.2声母和韵母
5.2.3汉语的音节结构
5.3汉语元音映射的提出
5.3.1汉语元音频谱的对比
5.3.2复韵母中单元音音素的滑动分析
5.3.3常用复韵母的分解实验
5.3.4二合元音共振峰分析
5.3.5韵母一元音分解的识别性能实验
5.3.6基于汉语元音映射的说话人识别框架
5.4基于汉语元音映射和仿生模式识别的说话人辨认
5.4.1基于频域能量分布分析的元音帧提取
5.4.2仿生模式识别理论
5.4.3基于仿生模式识别的说话人识别方法
5.4.4改进的最近邻覆盖算法
5.5说话人辨认实验
5.5.1辨认算法主要步骤
5.5.2实验结果与分析
5.6结论
第六章总结与展望
6.1论文工作总结
6.2研究展望
致谢
参考文献
附录