首页> 中文学位 >支撑大数据的实时数据集成系统的研究与实现
【6h】

支撑大数据的实时数据集成系统的研究与实现

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1 研究背景

1.2 国内外研究现状

1.3 本文主要研究内容

1.4 本文的结构安排

第二章 系统相关技术介绍

2.1 数据集成简介

2.2 ETL技术

2.3 消息中间件技术

2.4 规则引擎技术

2.5 本章小结

第三章 系统总体架构研究

3.1 传统数据集成系统架构分析

3.2 实时数据集成系统架构

3.3 本章小结

第四章 数据实时抽取和实时加载关键技术研究

4.1 变更数据实时抽取关键技术

4.2 目标数据实时加载

4.3 本章小结

第五章 实时转换关键技术研究

5.1 转换的实时性与稳定性分析

5.2 基于规则引擎的动态数据预处理

5.3 并发转换任务调度策略

5.4 本章小结

第六章 系统仿真实验

6.1 仿真实验环境

6.2 集成数据实时性测试

6.3 系统数据抽取效率测试

6.4 多任务并发下的集成数据实时性测试

6.5 本章小结

第七章 总结与展望

7.1 课题总结

7.2工作展望

致谢

参考文献

攻读硕士学位期间取得的成果

展开▼

摘要

当今社会,随着信息技术的不断发展,企业为了适应彼此间日趋频繁的业务活动和提高自身竞争力,投入大量资源研发针对各部门需求的业务系统。然而这些业务系统功能各异,彼此之间相互独立,各自的数据存储和访问方式都不相同。随着企业的日益壮大,企业内部数据呈现出数据量越来越大,数据来源与数据存储格式越来越多样化以及数据存储位置越来越离散化等特点。对一个企业来说,如何有效利用这些数据信息以及如何快速在的海量数据中获取对企业商业决策有利的信息,直接关乎企业的生死存亡,所以企业越来越重视如何将数据在逻辑上或者物理上有机地集中在一起,从而能为企业和部门提供更加全面的数据共享,使得企业能对商业信息的快速变化做出决策。实时数据集成技术是解决上述问题的关键技术。
  课题以数据集成作为研究背景,阐述了国内外数据集成技术的研究现状,并对课题相关技术做了简要介绍。在分析现有数据集成技术基础上,针对当今大数据环境下企业对数据实时性的需求,研究实现一个实用可靠的支撑大数据的实时数据集成系统。系统主要就集成数据实时性保障和对大量数据实时集成过程中系统稳定性保证两方面做相关研究。
  本文首先在研究传统数据集成系统架构和分析实时数据集成的功能和应用需求的基础上,提出一个通用的实时数据集成架构。然后从实时数据集成过程上分析,实时数据集成主要分为数据实时抽取、实时转换和实时加载三部分。在数据实时抽取问题上,通过分析在异构多源环境下数据实时抽取的过程与难点,提出了基于消息中间件的数据实时抽取方法,能快速有效的对不同数据源实现实时数据增量抽取任务。对于数据实时加载,采用基于实时数据缓存的的数据实时加载方法,实现在不影响数据仓库性能和保证集成数据实时性的情况下对大量集成数据的实时加载。然后针对数据实时转换过程,本文提出基于规则引擎的数据预处理方法和基于任务实时性需求的并发任务调度策略来优化转换过程,提高数据转换效率并保障转换任务的稳定性和集成数据的实时性。
  在最后,本文通过仿真实验对实时数据集成系统进行了测试,并根据实验结果分析验证了系统的可用性和稳定性。

著录项

  • 作者

    廖虹光;

  • 作者单位

    电子科技大学;

  • 授予单位 电子科技大学;
  • 学科 计算机应用技术
  • 授予学位 硕士
  • 导师姓名 郝玉洁;
  • 年度 2016
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.131;
  • 关键词

    数据集成系统; 实时性; 规则引擎; 任务调度;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号