首页> 外文会议>International Conference on Advanced Information Systems Engineering >Integrating Unnormalised Semi-structured Data Sources
【24h】

Integrating Unnormalised Semi-structured Data Sources

机译:集成无通知的半结构化数据源

获取原文

摘要

Semi-structured data sources, such as XML, HTML or CSV files, present special problems when performing data integration. In addition to the hierarchical structure of the semistructured data, the data integration must deal with the redundancy in serai-structured data, where the same fact may be repeated in a data source, but should map into a single fact in a global integrated schema. We term semi-structured data containing such redundancy as being an unnormalised data source, and we define a normal form for semi-structured data that may be used when defining global schemas. We introduce special functions to relate object identifiers used in the global data model to object identifiers in unnormalised data sources, and demonstrate how to use these functions in query processing, update processing and integration of these data sources.
机译:半结构化数据源,例如XML,HTML或CSV文件,在执行数据集成时出现特殊问题。除了半系统数据的分层结构之外,数据集成还必须处理SERAI结构数据中的冗余,其中可以在数据源中重复相同的事实,但应将其映射到全局集成架构中的单个事实中。我们术语包含此类冗余的半结构化数据作为非正常数据源,我们为半结构数据定义了正常形式,该数据可以在定义全局模式时使用。我们引入特殊功能以将全局数据模型中使用的对象标识符相关联到非正常数据源中的对象标识符,并演示如何在查询处理中使用这些功能,更新处理和这些数据源的集成。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号