声明
摘要
第1章绪论
1.1研究背景及意义
1.2说话人语音分割与聚类技术简介
1.3说话人语音分割与聚类技术研究发展现状
1.3.1说话人语音分割技术发展现状
1.3.2说话人语音聚类技术发展现状
1.4本文主要工作
2.1引言
2.2语音信号预处理
2.2.1预加重
2.2.2分帧、加窗与时频分析
2.3特征提取
2.3.1梅尔频率倒谱系数(MFCC)
2.3.2 MFCC特征参数提取方法
2.4本章小结
第3章基于改进双门限端点检测法的说话人语音分割算法研究
3.1引言
3.2语音分割方法的选取
3.3传统双门限端点检测算法研究
3.3.1短时能量和短时平均过零率特征
3.3.2双门限法端点检测原理
3.3.3双门限法端点检测的缺陷
3.4双门限端点检测算法的改进设计
3.4.1频谱质心特征
3.4.2中值滤波平滑处理法
3.4.3门限值选取算法
3.4.4基于改进双门限法的说话人语音分割步骤
3.5实验验证
3.5.1原始语音端点检测实验
3.5.2带噪语音端点检测实验
3.5.3实验结果对比分析
3.6本章小结
第4章基于自组织神经网络的改进k-means说话人聚类算法研究
4.1引言
4.2 k-means说话人聚类算法研究
4.3自组织神经网络说话人聚类算法研究
4.3.1自组织神经网络结构
4.3.2竞争学习规则
4.4基于自组织神经网络的改进k-means说话人聚类算法设计
4.4.1 k-means算法与自组织神经网络算法优缺点分析
4.4.2基于自组织神经网络的改进k-means说话人聚类算法步骤
4.5实验验证
4.5.1 k-means说话人聚类实验
4.5.2自组织神经网络说话人聚类实验
4.5.3基于自组织神经网络的改进k-means说话人聚类实验
4.5.4实验结果对比分析
4.6本章小结
第5章结论与展望
参考文献
致谢
附录
东北大学;