首页> 外文期刊>情報処理学会論文誌 >A Japanese Morphological Analysis Method Using a Statistical Language Model and an N-best Search Algorithm
【24h】

A Japanese Morphological Analysis Method Using a Statistical Language Model and an N-best Search Algorithm

机译:使用统计语言模型和N最佳搜索算法的日语形态分析方法

获取原文
获取原文并翻译 | 示例
           

摘要

We present a novel method for Japanese morphological analysis which uses a statistical language model and an N-best search algorithm. It has a probabilistic model for unknown words to parse unrestricted Japanese sentences accurately and it can get N-best morphological analysis hypotheses. When the statistical Japanese morphological analyzer was trained on the subset of the EDR corpus (about 190 thousand sentences, 4.7 million words) and tested on 100 sentences of open text, it achieved 94.6/100 recall and 93.5/100 precision for the top candidate, and 97.8/100 recall and 88.3/100 precision for the top five candidates.
机译:我们提出了一种使用统计语言模型和N最佳搜索算法进行日语形态分析的新方法。它具有未知单词的概率模型,可以准确地解析无限制的日语句子,并且可以获得N最佳的形态分析假设。当对日本语态统计分析器进行EDR语料库子集(约19万个句子,470万个单词)的训练,并在100个开放文本的句子上进行测试时,其最佳候选者的召回率为94.6 / 100,准确度为93.5 / 100,前5名候选人的召回率分别为97.8 / 100和88.3 / 100。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号