...
首页> 外文期刊>SIGMOD record >Web Table Taxonomy and Formalization
【24h】

Web Table Taxonomy and Formalization

机译:Web表分类法和形式化

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

The Web is the largest repository of data available, with over 150 million high-quality tables. Several works have combined efforts to allow queries on these tables, but there are still challenges, like the various different types of structures found on the Web. In this paper, we propose a taxonomy for the tabular structures and formalize the ones used with relational data and show, through an experimental evaluation, that WTClassifier, our supervised framework, classifies Web tables with high accuracy. Additionally, we use WTClassifier to categorize more than 300 thousand Web tables into our taxonomy and found that 82.25% are not formatted similarly to relational structure.
机译:Web是最大的可用数据存储库,拥有超过1.5亿张高质量表。多项工作共同努力以允许在这些表上进行查询,但是仍然存在挑战,例如在Web上发现的各种不同类型的结构。在本文中,我们提出了一种表格式结构的分类法,并将其与关系数据一起形式化,并通过实验评估表明,我们的监督框架WTClassifier对Web表进行了高精度分类。此外,我们使用WTClassifier将超过30万个Web表分类到我们的分类法中,发现82.25%的格式与关系结构的格式不同。

著录项

  • 来源
    《SIGMOD record》 |2013年第3期|28-33|共6页
  • 作者单位

    Universidade Federal de Santa Catarina Florianopolis, SC, Brazil;

    Universidade Federal de Santa Catarina Florianopolis, SC, Brazil;

    Universidade Federal de Santa Catarina Florianopolis, SC, Brazil;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号