摘 要
Abstract
第1章 引言
1.1.说话人识别
1.2.研究意义
1.2.1.轨线模型
1.2.2VQ模型
1.3.工作重点和论文组织结构
第2章说话人识别技术
2.1.说话人识别系统
2.1.1.语音处理分类
2.1.2. 说话人识别系统结构
2.1.3.系统性能评价
2.1.4.现有的软件平台
2.2.主流特征
2.2.1.美尔到谱系数(MFCC)
2.2.2.线性预测倒谱系数(LPCC)
2.3.说话人识别模型
2.3.1.矢量量化模型(VO-Vector Quantization)
2.3.2.混合高斯模型GMM
2.3.3.连续隐马尔可夫模型CHMM
2.3.4.其他模型
2.4.说话人识别测试数据库
2.4.1.YOHO Corpus
2.4.2.Phonedb数据库
2.4.3.SRMC Corpus
2.5.小结
第3章 基于段模型的说话人特征时序性发掘
3.1.段模型
3.1.1.段模型的矩阵描述
3.1.2.模型参数估计
3.2.段模型在语音识别中的应用
3 2.1.元音分类
3.2.2.关键词识别的二阶处理
3.3.说话人特征时序性发掘方法
3.3.1 Delta特征(DF:Delta Feature)
3.3.2.段单位输入(SUI:Segmental UnitInput)
3.3.3.特征向量拟合法(FV:Fitting Vectors)
3.3.4.特征修正增维法(AFAE:Amending Feature andAdding Error)
3.3.5. 特征增维法(AE:AddingError)
3.4.时序性发掘实验
3.4.1.性能检测实验
3.4.2.段模型参数对性能的影响
3.5.小结
第4章 基于Trended HMM的文本相关说话人识别
4.1.Trended HMM与HMM
4.2.模型描述
4.3.模型参数估计
4.3.1.分割
4.3.2.优化
4.3.3.其它参数估计方法
4.4.Trended HMM在语音识别中的应用
4.5.文本相关的说话人识别
4.5.1.实现方式
4.5.2.实验
4.6.Trended HMM与VIV
4.7.Trended HMM优缺点
4.8.小结
第5章 基于可变电码本VQ模型的说话人识别
5.1.研究动机
5.2.基于聚类有效性分析的可变电码本VQ模型
5.2.1.C-均值法
5.2.2.BIC(Bayesian Information Criterion)
5.2.3.电码本选择准则
5.3.实验结果与分析
5.4.其他应用探讨
5.5.小结
第6章总结与展望
6.1.总结
6.2.展望
附录一主要参考文献
附录二论文发表情况
致谢