首页> 中国专利> 一种基于随机深度时延神经网络模型的自动语音识别方法

一种基于随机深度时延神经网络模型的自动语音识别方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明属于自动语音识别技术领域，涉及一种基于随机深度时延神经网络模型的自动语音识别方法，包括：准备训练数据；对训练语音音频数据提取声学特征；训练传统GMM‑HMM模型，用训练好的GMM‑HMM模型对训练语音音频数据进行强制对齐，得到对应的帧级别训练标注；利用训练语音音频数据和对应的帧级别训练标注，对基于随机深度的时延神经网络模型进行监督训练，最终结合隐马尔科夫模型得到声学模型；利用对应的文本标注数据或者其他数据集的文本进行训练，得到训练好的语言模型；利用训练好的语言模型和声学模型，构建自动语音识别的解码器。本发明不仅提高了模型的建模能力，还解决了训练过程中过拟合以及梯度消失的问题，从而提高了语音识别的准确性。

著录项

公开/公告号CN109065033A

专利类型发明专利
公开/公告日2018-12-21

原文格式PDF
申请/专利权人华南理工大学;
展开▼

申请/专利号CN201811091089.1
发明设计人黄晓荣;张伟彬;徐向民;殷瑞祥;
展开▼

申请日2018-09-19
分类号
代理机构广州市华学知识产权代理有限公司;
代理人林梅繁
地址 510640 广东省广州市天河区五山路381号
入库时间 2023-06-19 07:48:00

法律信息

法律状态公告日

法律状态信息

法律状态
2019-01-15

实质审查的生效 IPC(主分类):G10L15/16 申请日:20180919

实质审查的生效
2018-12-21

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种基于随机深度时延神经网络模型的自动语音识别方法 [P] . 中国专利： CN109065033A . 2018-12-21
2. 一种基于同步随机存储器的动态多径时延模拟装置及方法 [P] . 中国专利： CN106533593A . 2017-03-22
3. Method and apparatus for performing random access based on delay determined by network [P] . 韩国专利： KR101527309B1 . 2015-06-09

机译：基于网络确定的时延进行随机接入的方法和装置
4. Method and apparatus for performing random access based on delay determined by network [P] . 美国专利： US8867562B2 . 2014-10-21

机译：基于网络确定的时延进行随机接入的方法和装置
5. METHOD AND APPARATUS FOR PERFORMING RANDOM ACCESS BASED ON DELAY DETERMINED BY NETWORK [P] . 韩国专利： KR20130136564A . 2013-12-12

机译：基于网络确定的时延进行随机访问的方法和装置