一种海量结构化数据处理技术研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着计算机的普及及互联网的迅猛发展，信息呈现爆炸式地增长。人们需要从这些越来越多、越来越复杂的数据中找到对自己有用的信息，因而，对于海量数据的处理和分析变得越来越重要。当前，社会上有很多针对海量数据处理和分析的工具，如Hadoop、各种并性数据库和HadoopDB等。但是，Hadoop处理结构化数据比较困难，HadoopDB仅仅是一个试验性的项目，由各种各样的缺点。因此，对于海量的结构化数据来说，需要一种新的处理技术或工具。
　　本文研究了一种基于Hadoop平台的海量结构化数据处理的技术。FlexDB系统使用SQL语言，便于学习和使用;使用ANTLR建立分析器，并对SELECT查询等操作做了一些优化，以便提高查询效率;基于MapReduce的思想，可以把所有的操作都分成子操作来完成。
　　要利用系统处理信息，首先要把要处理数据装载如系统，此时要对元数据数据序进行操作以记录下数据的基本信息并在各节点创建子表;然后可以对数据进行处理，主要是SELECT查询操作，并把处理结果显示出来或写存到相应的数据库中，也可能查询之后删除某些记录或字表，此时进行DELETE删除操作。
　　论文首先介绍了研究背景和意义，之后介绍了当前国内外海量结构化数据处理技术的现状;然后介绍了系统中使用的各种技术和相关思想;接着介绍了FlexDB系统的结构框架并详细描述了数据装载与语法分析器部分的实现;之后使用一组数据让FlexDB、Hive、HadoopDB分别进行处理，证明新技术的比较优势;最后对论文进行了总结。

著录项

作者
刘长城;
展开▼
作者单位

复旦大学;

展开▼
授予单位复旦大学;
学科计算机技术
授予学位硕士
导师姓名吴杰;
年度 2012
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.131;
关键词
\结构化; 数据处理; 语法分析器; Hadoop平台;

相似文献

中文文献
外文文献
专利

1. 分布式信号采集分析系统海量非结构化数据实时处理技术研究 [J] . 陈景兵 ,章林柯 ,何琳 . 微计算机信息 . 2011,第007期
2. 分布式信号采集分析系统海量非结构化数据实时处理技术研究 [J] . 陈景兵 ,章林柯 ,何琳 . 微计算机信息 . 2011,第003期
3. 输电线路巡检中海量非结构化数据的分布式存储技术研究 [J] . 吕啟尤 ,陆庭辉 ,吴毅良 . 湖南农机 . 2018,第006期
4. 输电线路巡检中海量非结构化数据的分布式存储技术研究 [J] . 吕啟尤 ,陆庭辉 ,吴毅良 . 时代农机 . 2018,第006期
5. MongoDB与Hadoop MapReduce的海量非结构化数据处理方案 [J] . 宋辰萱 ,孔祥文 . 电子技术与软件工程 . 2021,第002期
6. 基于E2LSH的海量非结构化数据元组快速归约方法 [C] . CHEN Jun-yue ,陈俊月 ,HAO Wen-ning . 2017中国系统仿真与虚拟现实技术高层论坛 . 2017
7. 基于RDBMS的海量结构化数据存储处理平台设计与实现 [A] . 汪黎 . 2013

一种海量结构化数据处理技术研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅