【24h】

On the Automatic Extraction of Data from the Hidden Web

机译:从隐藏的网络中自动提取数据

获取原文
获取原文并翻译 | 示例

摘要

An increasing amount of Web data is accessible only by filling out HTML forms to query an underlying data source. While this is most welcome from a user perspective (queries are easy and precise) and from a data management perspective (static pages need not be maintained; databases can be accessed directly), automated agents have greater difficulty accessing data behind forms. In this paper we present a method for automatically filling in forms to retrieve the associated dynamically generated pages. Using our approach automated agents can begin to systematically access portions of the "hidden Web."
机译:仅通过填写HTML表单以查询基础数据源即可访问越来越多的Web数据。从用户角度(查询简单而精确)和从数据管理角度(无需维护静态页面;可以直接访问数据库)来看,这是最受欢迎的,但是自动化代理在访问表单后面的数据时遇到了更大的困难。在本文中,我们提出了一种自动填写表单以检索关联的动态生成页面的方法。使用我们的方法,自动化代理可以开始系统地访问“隐藏的Web”的各个部分。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号