【24h】

Bootstrapping for example-based data extraction

机译:自举基于示例的数据提取

获取原文

摘要

The effortless generation of wrappers for Web data sources is a crucial task if proper access to the huge amount of semi-structured data on the Web is to be granted. In particular, the development of strategies for wrapper generation based on user-given examples is currently one of the most promising research directions in Web data extraction. In this paper we show how to use a pre-existing data repository to automatically generate examples and allow full automated example-based data extraction. To demonstrate the feasibility of our approach we provide a number of results obtained from experiments we carried out and discuss how our ideas can be used to improve extraction rates and for providing resilience and adaptiveness for example-based generated wrappers.
机译:如果要允许对Web上大量的半结构化数据进行适当访问,那么毫不费力地为Web数据源生成包装器是一项至关重要的任务。特别是,基于用户给出的示例开发包装器生成策略的方法是当前Web数据提取中最有希望的研究方向之一。在本文中,我们展示了如何使用预先存在的数据存储库自动生成示例,并允许基于示例的全自动数据提取。为了证明我们方法的可行性,我们提供了从我们进行的实验中获得的大量结果,并讨论了如何将我们的想法用于提高提取率以及为基于示例的生成包装程序提供弹性和适应性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号