首页> 中国专利> 用于语音识别的声学模型的建模方法、建模系统

用于语音识别的声学模型的建模方法、建模系统

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明涉及一种用于语音识别的声学模型的建模方法及语音识别系统。所述方法包括：训练一个初始模型，建模单元为经音素决策树聚类后的三音子状态，所述模型还给出状态转移概率；基于初始模型对训练数据语音特征的三音子状态进行强制对齐，获得其帧级别的状态信息；对深层神经网络进行预训练以得到各隐含层初始权重；基于所获得的帧级状态信息采用误差反向传播算法对已初始化的网络进行训练，更新权重。本发明采用上下文相关三音子状态做为建模单元，基于深层神经网络建模，使用受限波尔兹曼算法初始化所述网络各隐含层的权重，所述权重在后续还可以借助反向误差传播算法被更新，能够有效地缓解所述网络预训练时容易陷入局部极值的风险，并进一步提高声学模型的建模精度。

著录项

公开/公告号CN103117060B

专利类型发明专利
公开/公告日2015-10-28

原文格式PDF
申请/专利权人中国科学院声学研究所;北京中科信利技术有限公司;
展开▼

申请/专利号CN201310020010.7
发明设计人颜永红;肖业鸣;潘接林;
展开▼

申请日2013-01-18
分类号G10L15/14(20060101);G10L15/06(20130101);
代理机构11309 北京亿腾知识产权代理事务所;
代理人陈霁
地址 100190 北京市海淀区北四环西路21号
入库时间 2022-08-23 09:31:00

法律信息

法律状态公告日

法律状态信息

法律状态
2015-10-28

授权

授权
2013-06-19

实质审查的生效 IPC(主分类):G10L15/14 申请日:20130118

实质审查的生效
2013-05-22

公开

公开

相似文献

专利
中文文献
外文文献

1. 用于语音识别的声学模型的建模方法、建模系统 [P] . 中国专利： CN103117060B . 2015.10.28
2. 一种应用于语种识别的英语声学模型的建模方法及系统 [P] . 中国专利： CN108510978B . 2020.08.21
3. Acoustic model creation manner for speech recognition, the acoustic model creation device for speech recognition, the record media which records the acoustic model creation program and this program for speech recognition [P] . 日本专利： JP4256314B2 . 2009-04-22

机译：用于语音识别的声学模型创建方式，用于语音识别的声学模型创建设备，记录声学模型创建程序的记录介质以及用于语音识别的程序
4. LANGUAGE MODELING METHOD OF SPEECH RECOGNITION SYSTEM FOR REDUCING SCOPE OF DICTIONARY AND DECREASING RECOGNITION ERROR OF SPEECH RECOGNITION SYSTEM [P] . 韩国专利： KR20040107172A . 2004-12-20

机译：语音识别系统的语言建模方法，用于减少语音识别系统的字典范围和减小识别误差
5. Gesture modeling device, gesture modeling method, program for gesture modeling system, and gesture modeling system [P] . 日本专利： JP6651388B2 . 2020-02-19

机译：手势建模装置，手势建模方法，用于手势建模系统的程序以及手势建模系统