基于大数据的数据转换平台的设计与实现

代理获取

页面导航

目录
摘要
著录项
引文网络
相似文献
相关主题

摘要

随着计算机技术的迅猛发展，人们所接触的数据量呈现爆炸式增长。数据的不断增长在给人们带来巨大价值的同时，也给人们带来了巨大的挑战，海量数据处理工作已经成为当今研究的热点问题。针对数据预处理方面的具体问题，传统的算法无论是从效率上，还是从计算复杂度上都无法满足海量数据的处理需要。云计算的发展为大数据的处理提供了新的解决方案。云计算技术通过使存储和计算能力均匀的分布到集群中的多个存储和计算节点上，从而实现了对超大数据集的巨大的存储和计算能力。同时，各个企业研发各自的云平台用于数据处理、分析数据已经成为主流趋势。
　　本文在对海量数据处理进行具体研究的基础上，提出了可定制的数据转换平台方案来简化数据处理。为了保证数据质量，需要对数据集中的孤立点进行检测。因传统算法在聚类过程中时间复杂度较高，本文提出了一种将传统聚类算法并行化设计的孤立点检测方案。
　　在数据规则引擎设计方案中，设计了“动作流”的方式来抽象化数据处理动作，允许用户根据实际需要自定义数据处理的流程与方式。设计并实现了“输入-处理-输出”语句形式的配置文件来代替传统的SQL语句和代码编写，减少了人力的耗费。在孤立点检测方案中，将传统的K-Medoids聚类算法进行并行化设计，使得K-Medoids算法满足处理大数据集的需要，同时设计并实现了基于距离和的孤立点检测方法，使得用户无需进行参数设置就可进行数据集中孤立点的检测。通过实验证明，改进的孤立点检测算法大大提升了孤立点检测的效率和准确性。
　　本文的数据转换规则引擎方案适合于海量数据的处理工作，节约了大量的代码编写时间，并设计实现了基于距离和的孤立点检测算法进行孤立点的检测处理，具有较好的实用价值。

著录项

作者
汪博;
展开▼
作者单位

东南大学;

展开▼
授予单位东南大学;
学科软件工程
授予学位硕士
导师姓名吉逸,陈晓;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.13;
关键词
数据转换平台; 孤立点检测算法; 引擎设计; 大数据;

相似文献

中文文献
外文文献
专利

1. 基于云计算的脑卒中预防康复与护理大数据平台的设计与实现 [J] . 王闰 ,刘秋美 ,张圆 . 新型工业化 . 2021,第002期
2. 基于大数据的成绩数据分析平台设计与实现 [J] . 胡雅祺 ,王海丰 ,彭鑫 . 新型工业化 . 2021,第002期
3. 基于大数据的智慧警务保障平台设计与实现 [J] . 王俊修 ,房胜男 ,冯翌新 . 警察技术 . 2021,第003期
4. 基于大数据技术的用户行为分析平台的设计与实现 [J] . 吴荣灿 ,罗嘉龙 ,郑伙群 . 电脑知识与技术 . 2021,第012期
5. 基于大数据的在线教育平台的设计与实现 [J] . 达泓宇 ,田少卿 ,杜美玲 . 微型电脑应用 . 2021,第004期
6. 基于移动云与大数据搭建河长制云平台的设计与实现 [C] . 张宇 ,佟庆 . 辽宁省通信学会2019年度学术年会 . 2019
7. 基于Sqoop的数据转换平台设计与实现 [A] . 尹相儒 . 2018

基于大数据的数据转换平台的设计与实现

目录

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅