首页> 中文期刊>淮阴工学院学报 >基于Web数据挖掘的多因素科技专家信息提取方法

基于Web数据挖掘的多因素科技专家信息提取方法

     

摘要

由于网页信息呈现的多样性和复杂性,基于Web数据挖掘的信息提取准确率不高.为了提高科技专家Web信息挖掘的正确率,提出一种基于Web数据挖掘的多因素科技专家信息提取方法,对于网页给定统一资源定位符(URL)先进行网页正文提取,综合特征词在网页正文中的位置及特征词与特征词之间的距离构成最短距离匹配方法,抽取科技专家姓名、性别、出生年月、出生地点、职称等信息.实验结果表明,该方法获得了94.43%的查全率和92.34%的准确率,较好地满足了应用需求.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号