首页> 外国专利> Language model learning system, speech recognition system, language model learning method, and program

Language model learning system, speech recognition system, language model learning method, and program

机译:语言模型学习系统,语音识别系统,语言模型学习方法和程序

摘要

PPROBLEM TO BE SOLVED: To give good scores to a word string characteristic of a corpus before mixture when a plurality of corpora are mixed to learn a language model. PSOLUTION: A necessary word selection part 103 selects a necessary word from a corpus-A holding part 101 and a word ID imparting part 105 imparts a word ID characteristic of a corpus A thereto and saves them in a mixed corpus holding part 107. A corpus-B holding part 102, a necessary word selection part 104, and a word ID imparting part 106 also similarly operate. A class-ID imparting part 108 imparts a class ID to words saved in the mixed corpus holding part 107. A language model learning part 109 estimates a language model from the contents of the mixed corpus holding part 107 and stores it in a word language model holding part 110, a class language model holding part 111, and a smoothing information holding part 112. PCOPYRIGHT: (C)2005,JPO&NCIPI
机译:

要解决的问题:当混合多个语料库以学习语言模型时,在混合之前给语料库的单词串特性打好分数。

解决方案:必要词选择部分103从语料库-A保持部分101中选择必要的词,并且词ID赋予部分105向其赋予语料库A的特征词ID并将其保存在混合语料库保持部分107中。主体B保持部102,必要单词选择部104以及单词ID赋予部106也同样地动作。类别ID赋予部108对保存在混合语料库保持部107中的单词赋予类别ID。语言模型学习部109根据混合语料库保持部107的内容推定语言模型,并存储在单词语言模型中。保存部分110,类语言模型保存部分111和平滑信息保存部分112。

版权所有:(C)2005,JPO&NCIPI

著录项

  • 公开/公告号JP4810789B2

    专利类型

  • 公开/公告日2011-11-09

    原文格式PDF

  • 申请/专利权人 日本電気株式会社;

    申请/专利号JP20030335977

  • 发明设计人 石川 晋也;

    申请日2003-09-26

  • 分类号G10L15/18;

  • 国家 JP

  • 入库时间 2022-08-21 18:19:41

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号