基于众包工作流的多用户协同whaT-if分析工具的研究和实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着计算机网络与数据库技术的迅速发展和广泛应用，商业智能系统中的分析型处理（OLAP）在各种商业领域中扮演越来越重要的角色。随着数据处理技术在企业的成功应用，传统的OLAP数据分析操作（对数据进行聚集、汇总、切片和旋转等）已经不能适应当前大数据量、深度分析的需要，因而需要路径分析、时间序列分析、图分析、what-if分析等复杂的统计分析模型。
　　其中what-if分析是基于历史数据，对假设场景进行分析的重要手段，它可以为决策者提供重要的预测信息，是一种非常重要的决策支持分析过程，也是OLAP的深入应用之一。
　　但是随着大数据时代的来临，传统OLAP技术遇到了前所未有的挑战，已经无法胜任大数据分析的要求。目前，大数据OLAP系统均是以MapReduce的计算模型为依托的，但MapReduce的优势在于以批处理模式处理大数据集，在实时响应需求方面效率仍有待提高。在what-if分析处理中，delta表合并算法是最关键的一步，但传统的delta表合并算法在这种新的计算模型下，时间和空间上都受到严重制约。所以这种基于历史数据的应用场景假设分析需要更加有效的what-if数据视图生成机制的支持。
　　同时，随着OLAP的不断发展和企业级业务的需求变化，what-if分析已经很难由单一的用户独立完成，而是需要不同部门、不同层次用户的协同处理，而且处理过程也可能是分阶段来进行的。因此，在what-if分析中就需要多用户的协同处理机制的支持，并通过不同用户之间的协同来完成企业级决策的假设分析。
　　因此，本文针对大数据、多用户环境下what-if查询处理策略进行了研究，主要工作包括:
　　(1)在传统的delta表合并算法的基础上，提出了基于Bloom Filter和Distributed Cache两种改进方法以提高在大数据OLAP系统中what-if数据视图的生成性能，从而提高what-if的查询处理能力。在标准SSB数据集上与Hive进行对比的实验表明，基于Bloom Filter的what-if算法比在Hive上实现的效率提高了30％，而当delta表较小时，基于Distributed Cache的what-if算法的性能提高幅度更大。
　　(2)由于MapReduce本身适用于以批处理模式处理大数据集，过多的产生中间数据会增加磁盘IO的次数，影响了算法的效率。因此，本文将各what-if分析算法移植到Spark环境下，作为一个内存计算框架，Spark使用内存替代了HDFS存储中间结果，因此可以大大减少磁盘IO的次数，从而提升算法的效率。基于标准SSB测试数据集上的性能分析与实验结果表明，基于BloomFilter的算法和基于Distributed Cache算法，在性能上较于MapReduce中都有了大幅度的提高。
　　(3)针对what-if分析中需要多用户的协同处理，提出使用众包工作流的机制。为此提出了基于回溯式PDS的众包工作流算法和基于反馈式PDS的众包工作流算法。这两种算法都可以在不同用户之间的协作下对what-if分析目标进行业务上的分解，并采用预合并多版本假设数据更新的算法，将分解后的众多子delta表汇总生成最终的delta表，实现从业务逻辑到假设数据更新的转换。但不同的是，基于回溯式PDS的众包工作流算法在任务无法被完成时可以重新对任务进行分解，保证最终解决方案的正确性和可行性，但过多的回溯过程将会造成时空资源的浪费，所以又提出了基于反馈式PDS的众包工作流算法作为补充，牺牲部分任务的完成度来换取时空效率的提升。基于以上算法，本文设计实现了众包工作流，给出了Delta表生成算法的运行情况示例，结果显示众包工作流可以合理的分解what-if分析目标，并最终形成可以被what-if算法使用的delta表。

著录项

作者
徐欢;
展开▼
作者单位

东南大学;

展开▼
授予单位东南大学;
学科计算机应用技术
授予学位硕士
导师姓名何洁月;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类办公自动化系统;程序设计;
关键词
商业智能; what-if分析工具; delta表; 众包工作流; 统计分析模型;

相似文献

中文文献
外文文献
专利

1. 试论基于工作流的协同工作平台的研究与实现 [J] . 孙晓萍 . 石化技术 . 2018,第006期
2. 基于工作流的科研协同平台的研究与实现 [J] . 陈丹 ,王勇 ,王瑛 . 计算机工程与设计 . 2014,第003期
3. 基于协同工作流的企业信息化系统研究与实现 [J] . 曲伟达 . 中国电子商务 . 2013,第018期
4. 基于工作流的网络协同办公系统的研究与实现 [J] . 陈征 ,龚松春 ,陈恳 . 宁波广播电视大学学报 . 2006,第002期
5. 基于EDI的异地协同工作流管理系统研究与实现 [J] . 郭树行 ,兰雨晴 . 计算机系统应用 . 2004,第008期
6. 基于协同机制的多用户交互翻译系统的设计与实现 [C] . 王建德 ,陈肇雄 ,黄河燕 . 中国科学院计算技术研究所第六届计算机科学与技术研究生学术讨论会 . 2000
7. 基于多用户决策的众包无障碍检测系统的设计与实现 [A] . 李凯 . 2016

基于众包工作流的多用户协同whaT-if分析工具的研究和实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅