基于MapReduce的分布式编程框架的设计与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

作为一个拥有广大用户群的桌面产品，腾讯公司QQ电脑管家每天都会产生海量的用户数据。后台中心对于用户数据的处理与分析对于改进产品具有重大的意义。公司数据平台部的计算资源需要支持核心业务因而申请成本高，所以搭建一个灵活有效的分布式计算框架，利用空闲的开发机计算资源来完成日常统计与数据处理工作具有较高的实际意义。
　　MapReduce作为一个海量数据处理的架构被广泛用于各大领域之中。本文通过对于MapReduce架构的研究，进而提出并设计实现了一种基于MapReduce的分布式编程框架来简化对于日常海量数据处理的编程工作，以满足管家后台的数据处理需求。在设计与实现过程中，重点放在了此编程框架的任务调度与容错功能上面，以期待获得良好的错误恢复能力。在功能测试方面，本文使用一个QQ加速状态上报的词频统计程序来进行测试，并人工对一个处理节点施加障碍以验证容错机制是否可以探查到落后任务的产生。在性能测试方面，本文使用了词频统计程序与记录排序程序来模拟日常需求中的统计与数据处理问题。基于这两个测试程序对本框架的任务响应时间，总机器时间与加速比进行了分析，以证明本编程框架的确具备处理海量数据的能力。
　　通过以上完成的工作，本框架可以搭建在后台中心的开发机群上以完成管家日常统计工作与数据处理工作的计算任务，并具有良好的计算能力、容错性与可扩展性。

著录项

作者
盘隆;
展开▼
作者单位

哈尔滨工业大学;

展开▼
授予单位哈尔滨工业大学;
学科软件工程
授予学位硕士
导师姓名刘远超,邵付东;
年度 2011
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.13;
关键词
分布式计算框架; 数据处理; MapReduce架构; 任务调度; 容错功能;

相似文献

中文文献
外文文献
专利

1. 基于MapReduce的分布式光线跟踪的设计与实现 [J] . 郑欣杰 ,朱程荣 ,熊齐邦 . 计算机工程 . 2007,第022期
2. 基于MapReduce的分布式云计算数据挖掘方法 [J] . 薛慧敏 . 安阳师范学院学报 . 2020,第005期
3. 基于MapReduce架构的就地化分布式母线保护研究 [J] . 周小波 ,唐治国 . 电力系统保护与控制 . 2018,第006期
4. 基于MapReduce模式的大数据分布式计算态势分析 [J] . 郑钤 . 通讯世界 . 2018,第006期
5. 基于MapReduce的分布式贪心EM算法 [J] . 曹家庆 ,吴观茂 . 微型机与应用 . 2018,第005期
6. 基于MapReduce架构的分布式母线保护设计方案 [C] . ZHOU Xiao-bo ,周小波 ,TANG Zhi-guo . 2016年中国电机工程学会年会 . 2016
7. 面向分布式计算的网络编程框架设计与实现 [A] . 张苗 . 2015

基于MapReduce的分布式编程框架的设计与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅