基于Hadoop的并行化存储和处理方法及应用研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

在软件管理系统中，数据大部分存储在传统的关系型数据库中，但当业务复杂度的提高和数据量的不断增加，简单的通过单一节点的数据库处理方式已经无法满足用户对于希望快速获取反馈的需求，从而影响系统的工作效率。因此，采用分布式来来存储和处理海量数据为本文的主要研究课题。
　　本文以《教育部学位与研究生教育评估工作平台》的专家遴选模块的专家评分环节为研究基础，针对用户需要多次进行遴选才能确定方案，导致随着数据库中专家信息数据的不断增加，在有限的硬件资源下用户需要大量的时间等待结果。其中专家评分环节占据专家遴选大部分时间，因此本文提出了采用Hadoop平台的分布式存储和并行计算功能来提高专家评分环节效率的解决方案。
　　本文的主要研究思路为构建Hadoop平台，将Oracle数据库中的专家信息数据存储到Hadoop的HDFS分布式文件系统中，通过Hadoop提供的MapReduce框架的map和reduce接口，实现分布式专家评分程序，并以专家分数为键对专家记录进行排序和分组。最后，通过Oracle数据库和Hadoop平台下专家评分程序的实验对比，得出随着专家信息数据量的增加，以及现有数据量下随着专家评分规则复杂度提高，基于Hadoop的分布式专家评分程序有更高的效率。
　　本文利用分布式存储和并行计算，提出并实现了提高专家评分环节效率的解决方案，并通过实验对比结果，进一步验证了Hadoop分布式平台实际应用于专家评分环节的可行性。

著录项

作者
于海涛;
展开▼
作者单位

南开大学;

展开▼
授予单位南开大学;
学科计算机应用技术
授予学位硕士
导师姓名程仁洪;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.132.3;
关键词
专家遴选; 分布存储; 并行计算; 软件管理系统; 关系型数据库;

相似文献

中文文献
外文文献
专利

1. 基于Hadoop的云存储技术在档案馆的应用研究 [J] . 乔萌萌 . 信息与电脑 . 2019,第024期
2. 基于Hadoop的气象数据存储检索应用研究 [J] . 曾乐 ,陈东辉 ,肖卫青 . 信息系统工程 . 2014,第008期
3. 基于Hadoop云存储系统在设计院的应用研究 [J] . 黄滨 ,徐勇 ,吕岩 . 信息安全与技术 . 2012,第009期
4. 基于Hadoop平台FP-Growth算法并行化研究与实现 [J] . 戴伟敏 . 宁夏大学学报（自然科学版） . 2020,第001期
5. 基于Hadoop平台的K-means聚类算法并行化改进研究 [J] . 禤世丽 ,刘建明 . 玉林师范学院学报 . 2020,第3期
6. 基于Hadoop的KDM并行化制作研究与实现 [C] . 张鑫 . 第22届国际广播电视技术讨论会 . 2017
7. 基于hadoop的聚类算法并行化分析及应用研究 [A] . 陈爱平 . 2012

基于Hadoop的并行化存储和处理方法及应用研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅