首页> 中国专利> 一种基于Kaldi的中文语音识别声学模型构建方法

一种基于Kaldi的中文语音识别声学模型构建方法

摘要

本发明公开了一种基于Kaldi的中文语音识别声学模型构建方法,包含以下步骤:步骤一:获得语料集的音频集和对应的文字集;步骤二:将获得的文字集格式化;步骤三:从音频集中提取声学特征;步骤四:单音素训练;步骤五:基于高斯混合模型‑隐马尔科夫模型和深度神经网络‑隐马尔科夫模型的框架,进行如下动作:5.1将音频集根据声学模型对齐;5.2训练三音素模型;5.3根据声学模型重新对齐音频&重新训练三音素模型。利用本申请识别准确,识别效率高。

著录项

  • 公开/公告号CN111696525A

    专利类型发明专利

  • 公开/公告日2020-09-22

    原文格式PDF

  • 申请/专利权人 天津大学;

    申请/专利号CN202010381931.6

  • 申请日2020-05-08

  • 分类号G10L15/02(20060101);G10L15/06(20130101);G10L15/07(20130101);G10L15/14(20060101);

  • 代理机构12107 天津市三利专利商标代理有限公司;

  • 代理人张义

  • 地址 300072 天津市南开区卫津路92号

  • 入库时间 2023-06-19 08:20:46

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号