首页> 外文会议>Data integration in the life sciences >Instance Discovery and Schema Matching with Applications to Biological Deep Web Data Integration
【24h】

Instance Discovery and Schema Matching with Applications to Biological Deep Web Data Integration

机译:实例发现和与应用程序的模式匹配,以进行生物深层Web数据集成

获取原文
获取原文并翻译 | 示例

摘要

This paper presents data mining-based techniques for enabling data integration across deep web data sources. We target query processing across inter-dependent data sources. Thus, besides input-input and output-output matching of attributes, we also need to consider input-output matching. We develop data mining techniques for discovering the instances for querying deep web data sources from the information provided by the query interfaces themselves, as well as from the obtained output pages of the related data sources, by query probing using dynamically identified input instances. Then, using a hierarchical representation of schemas and by applying clustering techniques, we are able to generate schema matches. We show the effectiveness of our technique while integrating 24 query interfaces.
机译:本文介绍了基于数据挖掘的技术,可用于跨深度Web数据源进行数据集成。我们的目标是跨相互依赖的数据源进行查询处理。因此,除了属性的输入-输入和输出-输出匹配之外,我们还需要考虑输入-输出匹配。我们开发了数据挖掘技术,用于通过使用动态标识的输入实例进行查询探测,从查询界面本身提供的信息以及从获得的相关数据源的输出页面中发现用于查询深层Web数据源的实例。然后,使用模式的分层表示并通过应用聚类技术,我们可以生成模式匹配。我们展示了我们的技术在集成24个查询接口的同时的有效性。

著录项

  • 来源
    《Data integration in the life sciences》|2010年|p.148-163|共16页
  • 会议地点 Gothenburg(SE);Gothenburg(SE)
  • 作者单位

    Department of Computer Science and Engineering Ohio State University, Columbus OH 43210;

    Department of Computer Science and Engineering Ohio State University, Columbus OH 43210;

    Department of Computer Science and Engineering Ohio State University, Columbus OH 43210;

  • 会议组织
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类 生物工程学(生物技术);
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号