首页> 中文会议>第十九届全国数据库学术会议 >PLS:一种基于信息自动标引的最小推进分词算法及其实现

PLS:一种基于信息自动标引的最小推进分词算法及其实现

摘要

自动标引是文本信息预处理的基础和核心,摘要信息的自动标引仍是目前研究的热点.本文对自动标引的研究立足于档案文献这一专门领域.本文首次将基于词首最长匹配的词典分词法,结合基于段句分割符表及停用词表的切分标记分词法,运用于档案文献的摘要自动标引,提出并实现了"正向扫描(POSITIVESCANNER)+最大匹配(LONGEST_WORDMATCH)+最小推进(SHORTEST_WORDPUSH)"(简称PLS)的分词优化算法,最后设计了一个通用的档案信息标引系统.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号