首页> 中文期刊> 《通信学报》 >基于层叠隐马尔可夫模型的中文命名实体识别

基于层叠隐马尔可夫模型的中文命名实体识别

         

摘要

提出了一种基于层叠隐马尔可夫模型的中文命名实体一体化识别方法,旨在将人名识别、地名识别以及机构名识别等命名实体识别融合到一个相对统一的理论模型中.首先在词语粗切分的结果集上采用底层隐马尔可夫模型识别出普通无嵌套的人名、地名和机构名等,然后依次采取高层隐马尔可夫模型识别出嵌套了人名、地名的复杂地名和机构名.在对大规模真实语料库的封闭测试中,人名、地名和机构识别的F-1值分别达到92.55%、94.53%、86.51%.采用该方法的系统ICTCLAS在2003年5月SIGHAN举办的第一届汉语分词大赛中名列前茅.

著录项

  • 来源
    《通信学报》 |2006年第2期|87-94|共8页
  • 作者单位

    中国科学院计算技术研究所,北京,100080;

    北京信息科技大学中文信息处理研究中心,北京,100101;

    中国科学院计算技术研究所,北京,100080;

    中国科学院计算技术研究所,北京,100080;

    北京信息科技大学中文信息处理研究中心,北京,100101;

    北京信息科技大学中文信息处理研究中心,北京,100101;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 翻译机;
  • 关键词

    命名实体识别; 角色标注; ICTCLAS;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号