面向EasyWrangling的数据转换脚本执行引擎的研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

自助式的数据准备技术提供了一种基于图形化的交互式数据转换处理工具，能够根据用户在图形化界面中的鼠标点选等交互操作，推测用户的数据转换意图并生成数据转换操作，避免了对数据转换逻辑的程序编码。
　　面向大数据的自助式数据准备技术具有处理海量数据的能力，能够将用户的交互操作转换为针对大规模数据的数据处理逻辑，并保证相关处理逻辑的伸缩性和效率，实现高效可扩展的数据处理。
　　EasyWrangling是一个面向大数据的自助式数据准备工具，其主要由前端图形化界面程序和后端执行引擎两个部分构成。本文工作主要针对后端执行引擎进行。后端引擎通过对数据转换脚本进行解析和优化并生成对应的处理逻辑，对存储在Hadoop平台上的海量数据进行处理。本文主要对将由用户交互所生成的数据操作逻辑应用于处理大规模数据的问题以及EasyWrangling中后端执行引擎的设计实现进行了相关的研究。主要工作包括:
　　1.形式化地定义了面向大数据的自助式数据准备技术中所使用的数据模型以及针对数据模型的数据转换操作。设计了声明式的数据转换语言Wrangling DSL，用于描述用户在图形化交互界面中生成的数据转换操作。基于MapReduce计算模型，对面向大数据的自助式数据准备技术中的数据操作进行了设计和实现。
　　2.设计并实现了基于Wrangling DSL数据转换语言的脚本执行引擎原型系统，能够将数据转换脚本转换为Hadoop MapReduce分布式计算平台上的MapReduce上的程序。
　　3.针对单个数据转换脚本执行和多个数据转换脚本执行提出了优化方案来优化执行时的时空效率。通过实验检验了系统的伸缩性和性能，并对两种数据转换脚本执行优化方案进行了实验验证，印证了方案的可行性和有效性。

著录项

作者
魏嘉荣;
展开▼
作者单位

浙江大学;

展开▼
授予单位浙江大学;
学科计算机科学与技术
授予学位硕士
导师姓名陈刚;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.131;
关键词
大数据; 数据转换; 数据准备; 脚本执行引擎;

相似文献

中文文献
外文文献
专利

1. 利用内核脚本执行引擎优化系统调用过程 [J] . 夏盛明 . 电子技术与软件工程 . 2021,第003期
2. 基于BPMN的服务组合执行引擎的研究与实现 [J] . 班倩超 ,刘旭东 ,曾晋 . 计算机应用研究 . 2009,第007期
3. 面向云制造的服务组合执行引擎框架研究 [J] . 肖刚 ,项哲锐 ,张元鸣 . 图学学报 . 2018,第006期
4. 面向云制造的服务组合执行引擎框架研究 [J] . 肖刚12 ,项哲锐1 ,张元鸣2 . 图学学报 . 2018,第006期
5. 基于文本格式的地名普查数据转换的研究与实现 [J] . 王俊 . 有色金属文摘 . 2018,第005期
6. 面向时空大数据的开放式地理信息脚本引擎关键技术研究 [C] . WANG Shaohua ,王少华 ,ZHONG Ershun . 2015国际地理信息科学研讨会 . 2015
7. 面向AJAX脚本网络的网页爬行及解析技术的研究与实现 [A] . 张瑶 . 2012

面向EasyWrangling的数据转换脚本执行引擎的研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅