【24h】

Integrating Unnormalised Semi-structured Data Sources

机译:集成非规范化半结构化数据源

获取原文
获取原文并翻译 | 示例

摘要

Semi-structured data sources, such as XML, HTML or CSV files, present special problems when performing data integration. In addition to the hierarchical structure of the semistructured data, the data integration must deal with the redundancy in serai-structured data, where the same fact may be repeated in a data source, but should map into a single fact in a global integrated schema. We term semi-structured data containing such redundancy as being an unnormalised data source, and we define a normal form for semi-structured data that may be used when defining global schemas. We introduce special functions to relate object identifiers used in the global data model to object identifiers in unnormalised data sources, and demonstrate how to use these functions in query processing, update processing and integration of these data sources.
机译:半结构化数据源(例如XML,HTML或CSV文件)在执行数据集成时会出现特殊问题。除了半结构化数据的分层结构之外,数据集成还必须处理Serai结构化数据中的冗余,在该结构中,同一事实可以在数据源中重复,但应映射到全局集成架构中的单个事实。我们将包含这种冗余的半结构化数据称为非标准化数据源,并且为半球形数据定义了一种标准形式,可用于定义全局模式。我们引入了特殊的功能,以将全局数据模型中使用的对象标识符与未规范化数据源中的对象标识符相关联,并演示如何在查询处理,更新处理和这些数据源的集成中使用这些功能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号