首页> 中文学位 >面向声学信号处理的深度学习模型优化研究
【6h】

面向声学信号处理的深度学习模型优化研究

代理获取

目录

声明

第一章 绪论

1.1 研究背景

1.1.1 声学环境场景分类

1.1.2 语音音素识别

1.1.3 深度学习研究

1.2 面向声学信号处理的深度学习模型研究现状及其难点

1.2.1 声学信号的时域和频域处理方式研究

1.2.2 与语音语义弱相关的泛音素识别研究

1.3 本文的主要研究工作

1.3.1 面向声学环境场景分类的深度学习模型研究

1.3.2 面向与语音动画相关的音素识别模型研究

1.4 论文结构

第二章 相关研究

2.1 声学环境场景分类相关研究

2.1.1 传统的声学环境场景分类模型

2.1.2 基于单一神经网络的声学环境场景分类模型

2.1.3 基于混合神经网络的声学环境场景分类模型

2.2 语音音素识别相关研究

2.2.1 ASR中音素识别模型

2.2.2 传统的语音音素识别模型

2.2.3 基于深度学习的语音音素识别模型

第三章 面向环境场景声音分类的聚合时频域深度学习模型研究

3.1 引言

3.2 现有的相关深度学习模型分析

3.2.1 时序信息损耗和结构破坏

3.2.2 时域信息和频域信息结合不足

3.3 基于时频域聚合特征的混合神经网络模型

3.3.1 LCNN体系架构

3.3.2 时序增强的多通道时频域特征融合机制

3.3.3 Multi-LCNN整体结构

3.4 实验结果及分析

3.4.1 DCASE2016数据集及参数设置

3.4.2 性能分析

3.4.3 模型评估分析

3.5 本章小结

第四章 面向与语音动画相关的音素识别模型研究

4.1 引言

4.2 现有的相关深度学习模型分析

4.3 单样本多标签的连续音素识别模型研究

4.3.1 可处理时间序列结构数据的卷积神经网络模型

4.3.2 共享权值的连续多目标分类器模型及其损失函数

4.3.3 多目标学习的连续-卷积神经网络模型

4.4 实验结果及分析

4.4.1 数据集和参数设置

4.4.2 性能分析和评估

4.5 本章小结

第五章 工作总结与未来展望

5.1 工作总结

5.2 未来展望

致谢

参考文献

作者在学期间取得的学术成果

展开▼

著录项

  • 作者

    雷进;

  • 作者单位

    国防科学技术大学国防科技大学;

  • 授予单位 国防科学技术大学国防科技大学;
  • 学科 计算机科学与技术
  • 授予学位 硕士
  • 导师姓名 彭宇行;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 TP3TN9;
  • 关键词

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号