MapReduce模型
MapReduce模型的相关文献在2010年到2022年内共计142篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、电工技术
等领域,其中期刊论文115篇、会议论文7篇、专利文献146038篇;相关期刊68种,包括吉林大学学报(理学版)、西安交通大学学报、通信电源技术等;
相关会议6种,包括2016年全国高性能计算学术年会 、中国电机工程学会第13届青年学术会议、第8届全国计算机支持的协同工作学术会议(CCSCW-2012)暨全国第23届计算机技术与应用学术会议(CACIS-2012)等;MapReduce模型的相关文献由374位作者贡献,包括贾瑞玉、乐佳、何志学等。
MapReduce模型—发文量
专利文献>
论文:146038篇
占比:99.92%
总计:146160篇
MapReduce模型
-研究学者
- 贾瑞玉
- 乐佳
- 何志学
- 侯春萍
- 兰田
- 刘燕
- 刘顿
- 吴凡
- 周国军
- 姚昀东
- 孙功星
- 孟顺梅
- 宋晓
- 岑全
- 常鹏
- 张元鸣
- 张卫平
- 强彦
- 彭中华
- 徐俊
- 曾青华
- 朱妤晴
- 李亚龙
- 李洪亮
- 李莉
- 李鸿绪
- 梁正友
- 潘涛
- 王宝亮
- 王李坤
- 王永贵
- 王磊
- 田锋
- 窦万春
- 米小武
- 袁家斌
- 詹剑锋
- 谭皓予
- 赵亮
- 赵彦
- 路璐
- 郑小龙
- 郑庆华
- 陆佳炜
- 陈兴振
- 陈志奎
- 陈苗
- 马天
- 魏晓辉
- 齐天亮
-
-
刘妍东
-
-
摘要:
协同过滤算法广泛应用于电子商务网站的推荐系统中,它基于对大量用户历史行为数据的分析,挖掘用户的兴趣并向用户推荐合适的产品。为了能够处理大数据文件,使用Apache Mahout、MapReduce并行框架和和协同过滤进行有效并行查询处理。实验结果表明,该系统能够在大数据集上实现高效率和高可靠性。系统不仅限于电影推荐,还可以应用于电子商务的许多其他领域。
-
-
石碧瑶
-
-
摘要:
近年来随着大数据的发展,我们所面临的数据除了在数量上呈现爆炸式增长,其结构和类型也越来越多样化,面对这些海量数据,在完成存储之外,挖掘出其中有价值的部分才是关键。而传统的数据计算方式已经不能满足这些要求,经过研究与实践,分布式处理方式已经被越来越多的人认可,在此基础上,MapReduce计算模型得到了广泛的应用。MapReduce是一种针对大规模集群中分布式文件进行并行处理的计算模型,本文对其工作原理和工作流程进行了分析,并以WordCount为例,阐述了MapReduce以并行方式处理问题的思路。
-
-
吕颖利;
李春光
-
-
摘要:
泛在电力物联网中大数据的存储和查询是至关重要的环节。重点探索了基于规范化集成的数据集成方法和配电网大数据的存储需求,主要研究了Hadoop等系统文件的分布情况、Hadoop分布式文件系统(Hadoop Distributed File System,HDFS)以及MapReduce模型的框架结构,进而对数据存储分布进行优化升级,并进行联合查询的工作。
-
-
冷迪;
邱子良;
黄建华;
秦思远
-
-
摘要:
电力系统不良数据识别方法以单一误差为标准多次比对、多次循环,难以同时处理大量数据,导致不良数据识别误差大、速率低。为改进不良数据识别方法存在的缺陷,设计了基于分布式并行计算的电力系统不良数据识别方法。采用MapReduce模型搭建分布式并行计算框架;设定不良数据判断标准,预处理电力数据;利用标准残差向量和残差灵敏度,识别电力系统不良数据。通过试验验证识别方法的应用效果,结果表明所提方法的平均识别相对误差为12.51%,多种类不良数据漏检率较低,证实了该识别方法的应用效果良好。
-
-
赵彦;
孙俊
-
-
摘要:
在超大规模数据集的分簇管理上,存在大数据获取、存储、检索、分析和可视化等困难.面对爆炸式增长的数据,利用分布式、并行计算原理,在MapReduce模型的基础上构建并行粒子群优化算法(PSOC-MR),实现对超大规模数据的有效分簇处理.实验结果表明,PSOC-MR算法在集群节点数量与数据集大小等比例增加的情况下呈现良好的可扩展性,能在保持分簇质量的同时呈现线性加速,该算法可有效解决超大规模数据集的分簇问题,实现低成本、高性能的商用大数据分析.
-
-
李放
-
-
摘要:
本文引入MapReduce模型来解决决策分解的正确性问题进行了深入研究,并做出展望。随着大数据技术的进步与发展,人们意识到其自身蕴含的巨大价值,特别是决策分解价值更是无法衡量。而影响决策分解准确度的因素有很多,包括条件样本、决策系统、数据复杂度等。MapReduce模型能够并行计算大规模数据,便于操控底层细节,降低实现难度。
-
-
金先好
-
-
摘要:
本次研究基于MapReduce模型在并行式环境中提出一种高性能的计算机数据挖掘算法,将模型输入由原始的一个样本转变为一组样本代以减少Map布局数量,节约算法访问Map的时间开销;在此基础上,从特征赋权角度对K-means聚类算法,对差异簇的差异特征进行权重赋值,以降低特征数据噪声。测试结果显示,该算法在MapReduce并行式环境下呈现良好的数据挖掘准确率,并且聚类收敛用时最低,处理计算机大数据挖掘问题具有一定优势。
-
-
杨延庆;
袁华兵
-
-
摘要:
模糊K-means算法是一种能够定量地确定事物亲属关系的软聚类算法,由于该算法在大规模数据的分析和处理中存在的不足,因此提出一种基于MapReduce模型的并行化实现.首先在Map函数的输出传递给其他节点的Reduce函数之前,改进Combine函数设计,增加本地中间结果处理,减少通信开销,以提高MapReduce任务计算速度.然后在Hadoop分布式计算平台上对多组规模不同的数据集进行测试.实验表明,基于MapReduce的并行模糊K-means算法适合大规模数据的分析和处理,而且执行速度提高了约1.9倍,聚类效果更为显著.
-
-
马颖
-
-
摘要:
随着社会的进步和国民经济的发展,国民节能环保意识逐渐增强,逐渐认识到水资源对社会发展的重要性。为实现对水资源的科学管理与合理调度,必须要通过水体识别技术对水资源实际情况形成更为准确的了解。本文主要分析了一种分布式计算环境下的遥感图像水体识别技术。
-
-
黄基诞;
郑斐峰;
徐寅峰;
刘明
-
-
摘要:
考虑了平行机环境下安装时间具有退化效应且加工时间具有分步恶化效应的MapReduce模型调度优化问题.在MapReduce模型中,每个工件包含Map和Reduce两道工序.其中,Map工序可以分割成若干个子任务并在多台平行机上同时加工,而Reduce工序只有在该工件Map工序的所有子任务完成后才能启动加工,而且只能在一台机器上连续加工.研宄Reduce工序的启动安装时间具有线性恶化效应、两个工序的加工时间具有分步恶化效应的平行机调度问题,构建了以最小化最大完成时间为优化目标的混合整数规划模型.给出了问题解的一个下界;同时,设计了采用单纯形差分扰动机制的改进灰狼算法以及贪婪算法进行模型求解.最后,利用数值仿真实验,将灰狼优化算法、贪婪算法、遗传算法的解与问题的下界进行对比,验证了模型与所设计算法的有效性.
-
-
ZHANG Yuanming;
张元鸣;
CHEN Miao;
陈苗;
LU Jiawei;
陆佳炜;
XU Jun;
徐俊;
XIAO Gang
- 《2016年全国高性能计算学术年会》
| 2016年
-
摘要:
针对经典C4.5决策树算法存在过度拟合和伸缩性差的问题,提出一种基于Bagging的决策树改进算法,并基于MapReduce模型对改进算法进行了并行化.首先,基于Bagging技术对C4.5算法进行了改进,通过有放回采样得到多个与初始训练集大小相等的新训练集,并在每个训练集上进行训练,得到多个分类器,再根据多数投票规则集成训练结果得到最终的分类器;然后,基于MapReduce模型对改进算法进行了并行化,能够并行化处理训练集、并行选择最佳分割属性和最佳分割点,以及并行生成子节点,实现了基于MapReduce Job工作流的并行决策树改进算法,提高了对大数据集的分析能力.实验结果表明,并行Bagging决策树改进算法具有较高的准确度与敏感度,以及较好的伸缩性和加速比.
-
-
ZHANG Yuanming;
张元鸣;
CHEN Miao;
陈苗;
LU Jiawei;
陆佳炜;
XU Jun;
徐俊;
XIAO Gang
- 《2016年全国高性能计算学术年会》
| 2016年
-
摘要:
针对经典C4.5决策树算法存在过度拟合和伸缩性差的问题,提出一种基于Bagging的决策树改进算法,并基于MapReduce模型对改进算法进行了并行化.首先,基于Bagging技术对C4.5算法进行了改进,通过有放回采样得到多个与初始训练集大小相等的新训练集,并在每个训练集上进行训练,得到多个分类器,再根据多数投票规则集成训练结果得到最终的分类器;然后,基于MapReduce模型对改进算法进行了并行化,能够并行化处理训练集、并行选择最佳分割属性和最佳分割点,以及并行生成子节点,实现了基于MapReduce Job工作流的并行决策树改进算法,提高了对大数据集的分析能力.实验结果表明,并行Bagging决策树改进算法具有较高的准确度与敏感度,以及较好的伸缩性和加速比.
-
-
ZHANG Yuanming;
张元鸣;
CHEN Miao;
陈苗;
LU Jiawei;
陆佳炜;
XU Jun;
徐俊;
XIAO Gang
- 《2016年全国高性能计算学术年会》
| 2016年
-
摘要:
针对经典C4.5决策树算法存在过度拟合和伸缩性差的问题,提出一种基于Bagging的决策树改进算法,并基于MapReduce模型对改进算法进行了并行化.首先,基于Bagging技术对C4.5算法进行了改进,通过有放回采样得到多个与初始训练集大小相等的新训练集,并在每个训练集上进行训练,得到多个分类器,再根据多数投票规则集成训练结果得到最终的分类器;然后,基于MapReduce模型对改进算法进行了并行化,能够并行化处理训练集、并行选择最佳分割属性和最佳分割点,以及并行生成子节点,实现了基于MapReduce Job工作流的并行决策树改进算法,提高了对大数据集的分析能力.实验结果表明,并行Bagging决策树改进算法具有较高的准确度与敏感度,以及较好的伸缩性和加速比.
-
-
ZHANG Yuanming;
张元鸣;
CHEN Miao;
陈苗;
LU Jiawei;
陆佳炜;
XU Jun;
徐俊;
XIAO Gang
- 《2016年全国高性能计算学术年会》
| 2016年
-
摘要:
针对经典C4.5决策树算法存在过度拟合和伸缩性差的问题,提出一种基于Bagging的决策树改进算法,并基于MapReduce模型对改进算法进行了并行化.首先,基于Bagging技术对C4.5算法进行了改进,通过有放回采样得到多个与初始训练集大小相等的新训练集,并在每个训练集上进行训练,得到多个分类器,再根据多数投票规则集成训练结果得到最终的分类器;然后,基于MapReduce模型对改进算法进行了并行化,能够并行化处理训练集、并行选择最佳分割属性和最佳分割点,以及并行生成子节点,实现了基于MapReduce Job工作流的并行决策树改进算法,提高了对大数据集的分析能力.实验结果表明,并行Bagging决策树改进算法具有较高的准确度与敏感度,以及较好的伸缩性和加速比.
-
-
-
-
-
-
-
ZHANG Hong-li;
张红莉
- 《第18届全国信息存储技术学术会议》
| 2012年
-
摘要:
网络信息提取技术对于人们高速准确的从海量数据中提取所需要的信息变得非常重要,面临海量计算所带来的挑战,提出了基于MapReduce的网络信息提取方法,以淘宝网为数据源,提取用户对商品感兴趣程度,通过实验仿真,表明该方法对于海量网络信息提取具有较高的效率和很好的适应性.