【24h】

Bootstrapping for Example-Based Data Extraction

机译:引导用于基于示例的数据提取

获取原文

摘要

The effortless generation of wrappers for Web data sources is a crucial task if proper access to the huge amount of semi-structured data on the Web is to be granted. In particular, the development of strategies for wrapper generation based on user-given examples is currently one of the most promising research directions in Web data extraction. In this paper we show how to use a pre-existing data repository to automatically generate examples and allow full automated example-based data extraction. To demonstrate the feasibility of our approach we provide a number of results obtained from experiments we carried out and discuss how our ideas can be used to improve extraction rates and for providing resilience and adaptiveness for example-based generated wrappers.
机译:如果要授予对网上的大量半结构化数据进行适当访问,则Web数据源的不断产生的包装器是一个重要任务。特别是,基于用户给定的示例的包装生成策略的发展是目前Web数据提取中最有前景的研究方向之一。在本文中,我们展示了如何使用预先存在的数据存储库自动生成示例并允许完全自动化的基于示例的数据提取。为了证明我们的方法的可行性,我们提供了许多从我们进行的实验获得的结果,并讨论了我们的想法如何用于改善提取率,并为基于示例的生成包装提供弹性和适应性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号