首页> 中文学位 >数据抽取、转换、加载描述规范的研究与应用
【6h】

数据抽取、转换、加载描述规范的研究与应用

代理获取

目录

摘要

第一章 引言

1.1 研究背景

1.2 研究现状

1.2.1 ETL理论研究现状

1.2.2 现有ETL系统开发方法

1.3 本文的组织结构

第二章 ETL概述

2.1 数据仓库与ETL

2.2 数据ETL简介

2.3 ETL元模型规范CWM

第三章 基于XML的数据抽取、转换、加载的描述规范

3.1 ETL步骤

3.2 ETL描述规范的组成

3.3 ETL描述规范细则

3.3.1 数据抽取的描述规范

3.3.2 数据转换的描述规范

3.3.3 数据加载的描述规范

3.3.4 日志系统的描述规范

第四章 数据抽取、加载、转换规范解析系统的设计与实现

4.1 需求分析

4.1.1 功能需求

4.1.2 性能需求

4.2 详细设计

4.2.1 系统框架设计

4.4.2 数据结构设计

4.2.3 关键方法设计

4.2.4 XML文档解析流程

第五章 渤海海洋数据仓库ETL系统设计

5.1 问题描述

5.2 渤海海洋数据仓库ETL系统实现要点

5.2.1 系统功能要点

5.2.2 设计概要

5.2.3 功能实现举例

第六章 总结和展望

6.1 总结

6.2 展望

参考文献

攻读学位期间的研究成果

致谢

声明

展开▼

摘要

随着大数据时代的到来,数据仓库的重要性日益凸显。ETL(Extraction、Transformation、Loading)工具可将分布的、异构数据源中的数据抽取到临时中间层后进行清洗、转换、集成,进而加载到数据仓库中。然而,传统的ETL系统的开发方式需耗费大量人力物力,通用性较差。
   为此,本文采用基于元数据驱动的方法,针对现有的元数据描述没有完整的定义和统一的描述方法的问题,提出了一种简洁、通用的基于XML的ETL描述规范,利用动态内存管理、动态数据库连接池等技术优化了海量数据的处理,通过对行列转置等问题的研究实现了多维数据的处理。本文主要内容包括:
   1.提出了一套简洁、通用数据抽取、转换、加载的描述规范,为ETL每个功能模块的元数据模型描述提供规范。
   2.以XML为规范描述方式,设计并实现了对ETL描述规范的解析系统。该系统通过对规范中的实体定义相应方法,实现了对规范文档的读取、解析,并能按照文档内容进行数据抽取、转换和加载。
   3.基于ETL描述规范及其解析系统,完成了渤海海洋数据仓库中赤潮、海冰、风暴潮等19个主题的数据抽取转换加载。给出了数据格式不一致、数据抽取转换等问题的处理策略。

著录项

  • 作者

    姚志鹏;

  • 作者单位

    青岛大学;

  • 授予单位 青岛大学;
  • 学科 计算机软件与理论
  • 授予学位 硕士
  • 导师姓名 邵峰晶;
  • 年度 2013
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.13;
  • 关键词

    数据抽取; 数据转换; 加载描述规范; ETL工具;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号