首页> 外国专利> Language model creation device, language model creation method, speech recognition device, speech recognition method, program, and recording medium

Language model creation device, language model creation method, speech recognition device, speech recognition method, program, and recording medium

机译:语言模型创建设备,语言模型创建方法,语音识别设备,语音识别方法,程序和记录介质

摘要

A frequency counting unit (15A) counts occurrence frequencies (14B) in input text data (14A) for respective words or word chains contained in the input text data (14A). A context diversity calculation unit (15B) calculates, for the respective words or word chains, diversity indices (14C) each indicating the context diversity of a word or word chain. A frequency correction unit (15C) corrects the occurrence frequencies (14B) of the respective words or word chains based on the diversity indices (14C) of the respective words or word chains. An N-gram language model creation unit (15D) creates an N-gram language model (14E) based on the corrected occurrence frequencies (14D) obtained for the respective words or word chains.
机译:频率计数单元(15A)针对输入文本数据(14A)中包含的各个单词或单词链,对输入文本数据(14A)中的出现频率(14B)进行计数。上下文分集计算单元(15B)针对各个单词或单词链计算分集索引(14C),每个分集索引指示单词或单词链的上下文分集。频率校正单元(15C)基于各个单词或单词链的多样性指数(14C)来校正各个单词或单词链的出现频率(14B)。 N-gram语言模型创建单元(15D)基于针对各个单词或单词链获得的校正后的出现频率(14D)来创建N-gram语言模型(14E)。

著录项

  • 公开/公告号JP5459214B2

    专利类型

  • 公开/公告日2014-04-02

    原文格式PDF

  • 申请/专利权人 日本電気株式会社;

    申请/专利号JP20100525708

  • 发明设计人 寺尾 真;三木 清一;山本 仁;

    申请日2009-08-20

  • 分类号G10L15/197;G10L15/18;G10L15/183;G06F17/27;

  • 国家 JP

  • 入库时间 2022-08-21 16:12:08

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号