首页> 中文学位 >面向商业银行的数据仓库及工复杂即席查询设计与实现
【6h】

面向商业银行的数据仓库及工复杂即席查询设计与实现

代理获取

目录

声明

摘要

第1章绪论

1.1研究背景及意义

1.2国内外研究现状

1.3研究内容和论文结构

1.3.1研究内容

1.3.2论文结构

1.4小结

第2章本文核心技术分析

2.1数据仓库及其复杂即席查询分析

2.2数据仓库分析

2.2.1数据仓库定义及特征

2.2.2数据仓库模型

2.3即席查询分析

2.3.1 Hive计算引擎

2.3.2 Presto计算引擎

2.3.3计算引擎总结

2.4银行数据缓存

2.5 ETL数据抽取技术

2.6小结

第3章数据仓库设计

3.1银行数据仓库多维数据模型设计

3.1.1主题域设计

3.1.2银行事实表设计

3.1.3银行维度表设计

3.1.4银行多维数据模型

3.2数据仓库ETL设计

3.2.1模型设计

3.2.2 ETL集群任务调度设计

3.2.3 ETL集群调度算法

3.3小结

第4章复杂即席查询设计

4.1复杂即席查询

4.2计算引擎设计

4.3复杂查询拆分

4.3.1有向查询图

4.3.2有向生成树

4.3.3生成中间结果表

4.4可视化设计

4.5银行数据仓库及其复杂即席查询设计

4.6小结

第5章银行复杂即席查询平台系统的实现与测试

5.1.1系统需求分析

5.1.2系统架构

5.1.3系统功能设计

5.1.4系统实现

5.2系统测试

5.2.1ETL性能测试

5.2.2查询速度测试

5.3小结

第6章总结

6.1总结

6.2展望

参考文献

攻读学位期间的研究成果

致谢

展开▼

摘要

在金融行业信息化背景下,商业银行面临着创新能力不足、行业标准提升、资产不良率升高、监管力度加强、客户需求多样化、行业竞争激烈等困境,信息化改革是化解商业银行此类困境最快捷高效的手段,数据分析则是信息化改革中至关重要的一步。但是商业银行目前存在数据分散、数据格式不统一、数据集成不高效、数据分析慢等问题,使得数据分析十分困难。本文将对商业银行数据仓库及其复杂即席查询进行研究,解决商业银行数据分析闲难的问题,促使商业银行向数据驱动模式转型。 首先,设计商业银行数据仓库多维数据模型,利用数据抽取-转换-加载(Extract-Transform-Load,ETL)技术构建银行数据仓库。分析银行现有数据信息,使用可拓分类方法选取银行高价值数据,并设计银行主题域和相应事实表与维度表,建立商业银行数据仓库多维数据模型。设计分布式数据仓库ETL,利用贪婪算法结合优化后的遗传算法和蚁群算法完成ETL任务调度,实现数据仓库中数据的高效、稳定集成  其次,在商业银行数据仓库的基础上,设计数据仓库即席查询的汁算引擎,实现快速复杂即席查询。采用优度评价方法对现有计算引擎进行筛选,选择Hive和Presto两个计算引擎,利用它们各自的优点进行整合,形成全新的面向商业银行的整合型计算引擎。为了提升计算速度和计算能力,将复杂即席查询语句拆分为多个简单查询。通过构造有向查询图,对有向查询图进行深度优先遍历形成有向生成树,再利用广度优先遍历对有向生成村进行遍历生成中间结果表,将中间结果表存储在虚拟内存文件系统Alluxio中,通过中间结果表得出查询结果,实现数据的复杂即席查询。 最后,实现银行复杂即席查询平台系统,证实了商业银行数据仓库及其复杂即席查询研究成果的优越性。通过该系统进行ETL导入性能测试和数据即席查询速度测试,证实了通过本文研究所设计出来的银行数据仓库及其即席查询计算引擎解决了银行数据分散、数据格式不统一、数据分析慢等问题,从而解决了银行数据分析困难的问题,帮助银行实现信息化改革。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号