首页> 中文期刊>山西大学学报(自然科学版) >基于词向量的开放文本领域概念识别方法

基于词向量的开放文本领域概念识别方法

     

摘要

在领域知识库的构建过程中,领域概念的识别是一项非常重要的步骤.当前基于统计方法仅按词频进行领域概念的识别,而一些较长的重要领域概念恰恰是低频词,因而对低频领域概念识别准确率不高.为了提高低频领域概念的识别准确率,本文提出了一种基于词向量的加权HITS算法.此方法首先将开放文本中的领域概念表示为词向量,然后使用加权HITS算法计算其领域相关度,最终筛选出领域相关度超过一定阈值的领域概念构建领域知识库.实验证明,本文提出的方法与现有方法相比,在领域概念识别的准确率和召回率方面有一定的改进.特别地,该方法将低频领域概念识别召回率提高了10%.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号