首页> 中文期刊>中文信息学报 >中文专利文献术语自动识别研究

中文专利文献术语自动识别研究

     

摘要

中文专利文献中含有大量领域术语,对这些术语进行自动识别是信息抽取、文本挖掘等领域的重要任务.该文提出了基于专利文献标题的术语词性规则自动生成方法以及针对候选术语排序的TermRank算法.该方法首先从大量的中文专利文献标题中自动生成词性规则;然后利用生成的词性规则对中文专利文献正文部分进行规则匹配获得候选术语表;再利用提出的TermRank排序算法对候选术语表排序,最终得到术语列表.通过在9 725篇中文专利文献数据上实验,证实了该方法的有效性.

著录项

  • 来源
    《中文信息学报》|2016年第3期|111-117,124|共8页
  • 作者单位

    北京信息科技大学 网络文化与数字传播北京市重点实验室,北京 100101;

    北京信息科技大学 网络文化与数字传播北京市重点实验室,北京 100101;

    北京信息科技大学 网络文化与数字传播北京市重点实验室,北京 100101;

    北京城市系统工程研究中心,北京 100089;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

    术语自动识别; 专利文献; 信息抽取; 文本挖掘;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号