首页> 中文期刊>中文信息学报 >基于语料库的字母词语自动提取研究

基于语料库的字母词语自动提取研究

     

摘要

目前,很多最新的术语和专有名词,首先以字母词语的形式出现在汉语中,并日益广泛应用.而字母词语多数是汉语自动分词中的未登录词,其正确识别,将有助于提高中文分词、信息检索、搜索引擎、机器翻译等应用软件的质量.本文在对字母词语进行先期考察的基础上,分析了字母词语组成情况的复杂特征和自动识别的难点,结合字母词语的各种统计特征和其独有的特点--字母串"锚点",提出了从中心往两边扩展的规则加统计辅助的字母词语自动提取的算法.并且对字母词语的双语同现问题进行了处理.算法简单,但有效.召回率为100%,准确率在80%以上.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号