首页> 中文期刊> 《计算机应用与软件》 >C值和互信息相结合的术语抽取

C值和互信息相结合的术语抽取

     

摘要

在目前的生物信息领域开放语料的术语抽取实验中,前2000多个双字词的精度已经达到了90.36%,但是三字以上的词的抽取精度只有66.63%,多字词的抽取成为了名词术语自动抽取的一个难点问题.针对该难点,提出综合C-value参数在长术语抽取方面的优势,并与术语抽取中的互信息参数相结合的策略来识别术语.实验结果表明,长术语抽取正确率为75.7%,召回率为68.4%,F测量值为71.9%,高于相同语料下的其他方法.

著录项

  • 来源
    《计算机应用与软件》 |2010年第4期|108-110|共3页
  • 作者

    梁颖红; 张文静; 张有承;

  • 作者单位

    苏州市职业大学江苏省现代企业信息化应用支撑软件工程技术研究开发中心;

    江苏;

    苏州;

    215104;

    东北林业大学信息与计算机工程学院;

    黑龙江;

    哈尔滨;

    150040;

    东北林业大学信息与计算机工程学院;

    黑龙江;

    哈尔滨;

    150040;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

    术语抽取; C值; 互信息;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号