首页> 中国专利> 用于语音识别的声学模型的建模方法、建模系统

用于语音识别的声学模型的建模方法、建模系统

摘要

本发明涉及一种用于语音识别的声学模型的建模方法及语音识别系统。所述方法包括:训练一个初始模型,建模单元为经音素决策树聚类后的三音子状态,所述模型还给出状态转移概率;基于初始模型对训练数据语音特征的三音子状态进行强制对齐,获得其帧级别的状态信息;对深层神经网络进行预训练以得到各隐含层初始权重;基于所获得的帧级状态信息采用误差反向传播算法对已初始化的网络进行训练,更新权重。本发明采用上下文相关三音子状态做为建模单元,基于深层神经网络建模,使用受限波尔兹曼算法初始化所述网络各隐含层的权重,所述权重在后续还可以借助反向误差传播算法被更新,能够有效地缓解所述网络预训练时容易陷入局部极值的风险,并进一步提高声学模型的建模精度。

著录项

  • 公开/公告号CN103117060B

    专利类型发明专利

  • 公开/公告日2015-10-28

    原文格式PDF

  • 申请/专利号CN201310020010.7

  • 发明设计人 颜永红;肖业鸣;潘接林;

    申请日2013-01-18

  • 分类号G10L15/14(20060101);G10L15/06(20130101);

  • 代理机构11309 北京亿腾知识产权代理事务所;

  • 代理人陈霁

  • 地址 100190 北京市海淀区北四环西路21号

  • 入库时间 2022-08-23 09:31:00

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-10-28

    授权

    授权

  • 2013-06-19

    实质审查的生效 IPC(主分类):G10L15/14 申请日:20130118

    实质审查的生效

  • 2013-05-22

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号