首页> 中文期刊>计算机科学 >基于词条组合的军事类文本分词方法

基于词条组合的军事类文本分词方法

     

摘要

针对传统的分词方法切分军事类文本存在未登录词多和部分词条特征信息不完整的问题,提出把整个分词过程分解为若干子过程,以词串为分词单位对军事类文本进行分词.首先基于词典对文本进行双向扫描,标识歧义切分字段,对切分结果一致的字段进行停用词消除,计算第一次分词得到的词条间的互信息和相邻共现频次,根据计算结果判定相应的词条组合成词串并标识,最后提取所标识的歧义字段和词串由人工对其进行审核处理.实验结果表明,词条组合后的词串的特征信息更丰富,分词效果更好.

著录项

  • 来源
    《计算机科学》|2010年第2期|171-174|共4页
  • 作者

    黄魏; 高兵; 刘异; 杨克巍;

  • 作者单位

    国防科学技术大学信息系统与管理学院,长沙,410073;

    国防科学技术大学信息系统与管理学院,长沙,410073;

    湖南师范大学文学院,长沙,410081;

    国防科学技术大学信息系统与管理学院,长沙,410073;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 检索机;
  • 关键词

    军事; 文本; 分词; 词条;

  • 入库时间 2023-07-24 19:22:46

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号