首页> 中文期刊> 《通信学报》 >基于属性值序列图模型的deep Web新数据发现策略

基于属性值序列图模型的deep Web新数据发现策略

         

摘要

针对数据源新产生数据记录的增量爬取问题,提出了一种deep Web新数据发现策略,该策略采用一种新的属性值序列图模型表示deep Web数据源,将新数据发现问题转化为属性值序列图的遍历问题,该模型仅与数据相关,与现有查询关联图模型相比,具有更强的适应性和确定性,可适用于仅仅包含简单查询接口的deep Web数据源.在此模型的基础上,发现增长节点并预测其新数据发现能力;利用互信息计算节点之间的依赖关系,查询选择时尽可能地降低查询依赖带来的负面影响.该策略提高了新数据爬取的效率,实验结果表明,在相同资源约束前提下,该策略能使本地数据和远程数据保持最大化同步.

著录项

  • 来源
    《通信学报》 |2016年第3期|20-32|共13页
  • 作者单位

    江苏省现代企业信息化应用支撑软件工程技术研发中心,江苏 苏州 215104;

    苏州大学智能信息处理及应用研究所,江苏 苏州 215006;

    苏州市职业大学计算机工程学院,江苏 苏州 215104;

    江苏省现代企业信息化应用支撑软件工程技术研发中心,江苏 苏州 215104;

    苏州大学智能信息处理及应用研究所,江苏 苏州 215006;

    苏州大学智能信息处理及应用研究所,江苏 苏州 215006;

    江苏省现代企业信息化应用支撑软件工程技术研发中心,江苏 苏州 215104;

    苏州市职业大学计算机工程学院,江苏 苏州 215104;

    江苏省现代企业信息化应用支撑软件工程技术研发中心,江苏 苏州 215104;

    苏州市职业大学计算机工程学院,江苏 苏州 215104;

    江苏省现代企业信息化应用支撑软件工程技术研发中心,江苏 苏州 215104;

    苏州市职业大学计算机工程学院,江苏 苏州 215104;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 各种专用数据库;
  • 关键词

    deep Web; 新数据发现; 数据获取;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号