首页> 中文学位 >复杂环境下特定说话人的语音识别研究
【6h】

复杂环境下特定说话人的语音识别研究

代理获取

目录

声明

1 绪论

1.1 背景

1.2 说话人识别

1.2.1 说话人识别的分类

1.2.2说话人识别的模型的分类

1.3说话人识别的系统性能评价标准

1.3.1 ROC曲线

1.3.2 FA-FR曲线和等误识率

1.3.3 检查代价函数

1.3.4 DET曲线

1.4 复杂环境下的说话人识别

1.4.1 基于信号特征的噪音鲁棒算法

1.4.2 基于模型的噪音鲁棒算法

1.5 本文使用到的语料库

1.5.1 TIMIT语音库

1.5.2 NOISEX-92数据库

1.6 论文的安排

2 说话人特征参数提取

2.1 语音信号的预处理

2.1.1 预加重(Pre-emphasis)

2.1.2加窗处理(Frame Blocking)

2.2 语音信号的特征参数的分类

2.2.1时域特征

2.2.2 线性预测编码参数

2.2.3 频域及倒谱特征

2.2.4 基于听觉特征的参数

2.3 LPCC

2.4 MFCC特征

2.4.1 MFCC参数的具体计算过程

2.4.2 临界带宽

2.5 PLP参数

2.5.1 PLP特征提取的过程

2.6 小结

3 说话人识别中特征提取的鲁棒性

3.1 Delta参数

3.2 PCA

3.2.1 随机向量的k1展开

3.2.2 k1降维的实现

3.3 谱减法与非线性谱减法

3.3.1 噪声谱的估计

3.4 倒谱均值相减法(CMS)

3.5 倒谱均值与方差归一化法(CMVN)

3.6 RASTA

3.6.1 特征提取的RASTA-PLP 技术

3.7特征弯折(Feature Warping)

3.8 本章小结

4 基于GMM-UBM说话人识别模型

4.1 GMM模型

4.1.1 GMM的参数估计

4.2 一种新的抗噪特征参数用于GMM模型的说话人识别

4.2.1 参数的提取

4.2.2 实验结果

4.3 基于高斯混合模型-通用背景模型(GMM-UBM)的说话人确认

4.3.1 基于UBM-GMM说话人确认的的训练过程

4.3.2 基于UBM-GMM说话人确认的确认过程

4.4 GMM与GMM—UBM的性能比较

4.5 本章小结

5 GMM和SVM的混合模型

5.1 SVM模型

5.1.1研究意义

5.1.2 基于风险最小的机器学习方法

5.1.3 分类间隔最大

5.1.4线性判决边界

5.1.5 非线性判决边界

5.2 SVM在说话人确认中的应用

5.3 GMM-SVM系统

5.3.1 SVM的概率输出

5.4基于GMM super vector线性核函数的SVM用于说话人确认系统

5.5 本章总结

6 总结与展望

6.1 工作总结

6.2 工作展望

致谢

参考文献

附录

展开▼

著录项

  • 作者

    张琪;

  • 作者单位

    武汉纺织大学;

  • 授予单位 武汉纺织大学;
  • 学科 物理电子学
  • 授予学位 硕士
  • 导师姓名 程建政;
  • 年度 2012
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号