首页> 中文期刊> 《常熟理工学院学报》 >词结合型未登录词识别方法研究

词结合型未登录词识别方法研究

         

摘要

介绍一种基于词结合提取的未登录词识别方法.该方法对碎片分词后的文本建立二元模型,结合互信息和规则过滤提取由若干个词组合而成的未登录词(组).测试结果准确率为84.71%,召回率为72.13%%  This paper introduces a method to extract unknown Chinese words based on compound words recogni⁃tion. This method builds a bi-gram model on the text which is processed by fragments segmentation, and it uses mutual information and regulations to combine some adjacent words to unknown words. The precision on the open test sets is 84.71% and recall is 72.13%.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号