首页> 中文学位 >山西大同地方方言语音识别技术及应用研究
【6h】

山西大同地方方言语音识别技术及应用研究

代理获取

目录

声明

1. 绪 论

1.1 研究背景及意义

1.1.1 研究背景

1.1.2 研究意义

1.2国内外研究现状

1.2.1 语音识别研究现状

1.2.2 方言语音识别研究现状

1.2.3 大同方言研究现状

1.3 创新点

1.4 全文组织结构

2. 山西大同地方方言的特点及语音数据集的构建

2.1 大同方言的特点

2.1.1 大同方言与普通话声母的区别

2.1.2 大同方言与普通话韵母的区别

2.2 大同方言语音数据集的构建

2.2.1 发音文本素材的选取

2.2.2 录音工作

2.2.3 语音加工及标注

2.2.4 数据信息汇总

2.2.5 大同方言数据集构建成果简介

2.3本章小结

3. 语音识别相关理论

3.1 音频特征提取

3.1.1 Filter bank与 MFCC

3.1.2 语谱图简介

3.2 声学模型

3.2.1 GMM-HMM声学模型

3.2.2 DNN-HMM 声学模型

3.2.3 CNN-HMM声学模型

3.2.4 递归神经网络及其变体用于声学建模

3.2.5 基于 CTC 规则的端到端语音识别模型

3.2.6 注意力机制(Attention)

3.3 语言模型

3.3.1 N-gram 语言模型

3.3.2 神经网络语言模型

3.4 子空间高斯混合模型

3.5本章小结

4. 大同方言语音识别方法研究

4.1 多核卷积融合网络

4.2 基于 Attention 的大同方言语音翻译研究

4.2.1 基于 Attention 的语音翻译模型结构的编码过程

4.2.2 基于 Attention 的语音翻译模型结构的解码过程

4.3 实验

4.3.1 实验数据

4.3.2 多核卷积支路的加权系数实验

4.3.3 声学模型预加 MCFN的效果实验

4.3.4 深度层数对比实验

4.3.5 语音翻译模型效果对比实验

4.4 本章小结

5. 大同方言语音识别技术应用前景简介

5.1 语音助手

5.2 身份认证

5.3 医疗辅助诊断

5.4 本章小结

6. 总结与展望

6.1全文总结

6.2存在不足与未来展望

参 考 文 献

攻读博士或硕士学位期间所取得的研究成果

致 谢

展开▼

著录项

  • 作者

    刘晓峰;

  • 作者单位

    中北大学;

  • 授予单位 中北大学;
  • 学科 软件工程
  • 授予学位 硕士
  • 导师姓名 宋文爱,余本国;
  • 年度 2020
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 H31TP3;
  • 关键词

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号