第一个书签之前
摘 要
ABSTRACT
目 录
1 绪 论
1.1 研究背景和意义
1.2 国内外研究现状
1.2.1 说话人语音分割研究现状
1.2.2 口音分类的研究现状
1.3 本文的研究内容
1.4 本文研究内容与组织结构
1.5 本章小结
2 CALL-CENTER环境介绍及语音研究的基础理论
2.1 CALL-CENTER环境的概念及场景数据特征
2.2 语音信号的生成感知系统及模型
2.2.1 语音信号的生成系统
2.2.2 语音信号的感知系统
2.2.3 语音信号的生成模型
2.3.1 线性预测倒谱参数
2.3.2 美尔频率倒谱参数
2.3.3 语谱图
2.3.4 韵律特征
2.4 MFCC_SPECTROGRAM融合特征的提取
2.5 本章小结
3 基于卷积神经网络的说话人分割方法
3.1 卷积神经网络
3.1.1 卷积神经网络的结构特征及原理
3.1.2 卷积神经网络的训练
3.2 说话人语音分割算法
3.3 融合特征下基于卷积神经网络的说话人语音分割方法
3.3.1 融合特征下基于卷积神经网络的说话人语音训练模型
3.3.2 融合特征下基于卷积神经网络的说话人语音分割模型
3.4 实验分析与结论
3.4.1 实验数据及介绍
3.4.2 数据预处理及数据集构造
3.4.3 实验评估方法
3.4.4 实验结果及分析
3.5 本章小结
4 基于说话人分割的不同口音对话自适应识别
4.1 语音识别系统
4.1.1 语音识别技术及发展
4.1.2 科大讯飞语音识别系统
4.2.1 汉语口音分类的原理
4.2.2 基于说话人分割的不同口音语音识别模型
4.3 实验分析与结论
4.3.1 实验数据及介绍
4.3.2 数据预处理及数据集构造
4.3.3 实验评估方法
4.3.4 实验结果及分析
4.4 本章小结
5 总结和展望
5.1 本文工作总结
5.2 未来工作展望
致 谢
参考文献
附 录
A 作者在攻读学位期间成果目录
B 作者在攻读学位期间参加的项目
重庆大学;