首页> 中文会议>第四届全国学生计算语言学研讨会(SWCL-2008) >基于联合权重的多文档关键词抽取技术

基于联合权重的多文档关键词抽取技术

摘要

本文对内容相近的多个文档抽取关键词,考虑到TF*IDF方法仅适于计算词语在单个文档中的权重,提出了一种计算词语权重的方法ATF*PDF。此方法能计算词语在多文档中的权重。首先对文档词语进行权重计算选取候选关键词,然后结合词语之间的语义相似度进行关键词抽取。实验表明,此方法能有效抽取多个文档的关键词,同基于关键词的聚类标记方法相比,其准确率,召回率和F值均有较大提高。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号