Hadoop平台
Hadoop平台的相关文献在2010年到2022年内共计343篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、电工技术
等领域,其中期刊论文222篇、会议论文22篇、专利文献216088篇;相关期刊129种,包括人天科学研究、电子设计工程、现代电子技术等;
相关会议22种,包括第十二届中国智能交通年会、2016电力行业信息化年会、2016年全国计算机体系结构学术年会 (ACA2016)等;Hadoop平台的相关文献由905位作者贡献,包括丁祥武、刘勇、廖召正等。
Hadoop平台—发文量
专利文献>
论文:216088篇
占比:99.89%
总计:216332篇
Hadoop平台
-研究学者
- 丁祥武
- 刘勇
- 廖召正
- 杨军超
- 王小平
- 雒江涛
- 高伟
- 丁岳伟
- 乐嘉锦
- 付忠广
- 周国军
- 孙韩林
- 曹建芳
- 胡谷雨
- 赵霞
- 马军
- 高学伟
- 付印金
- 伏晓
- 何凌毅
- 何志学
- 侯帅
- 倪桂强
- 傅燕翔
- 傅靖
- 冼炳洪
- 刘建伟
- 刘文凤
- 刘晨
- 刘杰
- 刘海璇
- 刘炳含
- 刘青
- 刘飞
- 刘鹏
- 匡祥干
- 华光辉
- 史忠植
- 史昊
- 史梦丽
- 叶丹
- 叶荣波
- 向程超
- 吕兆龙
- 吕太之
- 吕征
- 吴三平
- 吴健
- 吴凯峰
- 吴华芹
-
-
宣正邦;
黄树成;
王逊
-
-
摘要:
传统Apriori算法在大数据挖掘中存在速度慢、效果差等缺点,论文提出一种基于Hadoop平台的Apriori改进算法:改进算法的数据库扫描机制,优化运算过程中迭代方法。将改进后的Apriori算法与Hadoop平台相结合,有效地克服了传统Apriori算法的缺点,极大地提高了海量数据挖掘的效率,实验结果验证了算法的优势。
-
-
黄安
-
-
摘要:
本文通过搭建Hadoop平台搭建校本数据中心,并将数据集中存储在HBase数据库中。基于Hadoop的校本数据中心,提供了强大的数据统一存储和计算力,将校本数据进行了整合及标准化,形成数据中心的标准库和主题库,为广大师生提供数据查询、数据分析等各种数据服务。校本数据中心能够实现内信息化精益化运营分析,支持实时统计分析的管理辅助决策、基于大数据的数据分析决策以及科研数据辅助决策等;可满足高校的数据利用、教学质量管理、科研管理及绩效管理等需求。
-
-
唐建海
-
-
摘要:
为了进一步提高网络安全趋势大数据的挖掘性能,提出一种基于Hadoop平台的网络安全趋势大数据深度挖掘方法。考虑网络安全趋势大数据信息缺失的情况,在Hadoop平台中筛选数据特征,剔除无用特征以降低数据维度。选择数据覆盖节点,重新确定聚类质心,改进大数据挖掘算法。融合Hadoop平台与改进大数据挖掘算法,将网络安全趋势大数据按照体量顺序排列,实现深度挖掘。实验结果证明,该算法在挖掘过程中未偏离数据密集区域,并在查全率与查准率方面均具有优势。
-
-
李林国;
查君琪;
赵超;
叶文;
李淑敬
-
-
摘要:
针对大数据可视化需求,基于网络公开的用户行为大数据(部分数据可以借助网络爬虫等算法自主抓取),依托Hadoop开源大数据处理平台,利用JavaWeb中的编程框架,辅助以各种可视化工具,设计实现了大数据的可视化分析及应用.在完成大数据可视化处理操作的同时,实现了多源多类大数据的可视化分析与展示.通过实验分析,能够实现不同大数据应用领域的可视化数据分析,为用户提供便捷、有效的大数据处理与应用业务.
-
-
郭霏霏
-
-
摘要:
为了准确获取移动物联网真实数据深层挖掘结果,制定合理的移动物联网建设规划,提出基于智能技术的移动物联网数据深层挖掘技术。构建基于Hadoop的数据存储平台,利用分布式计算完成移动物联网数据管理和存储。采用智能技术获得移动物联网周边基站布局状况,构建多元化移动物联网用户行为整合模型。提取挖掘路径耗损和挖掘距离等信息,将均方误差最小的挖掘路径耗损方程作为可信度较小解,剔除错误样本点,从高到低排列信号强度,获取数据深层挖掘盲点及重复数据深层挖掘区域,完成移动物联网数据深层挖掘计算。实验结果表明,所提出方法的数据挖掘分数较高,能够有效获取目标区域移动物联网数据深层挖掘情况,准确分析移动物联网数据深层挖掘,从而合理地规划移动物联网建设。
-
-
-
杨华芬;
陈斌
-
-
摘要:
针对经典自适应滤波算法处理机械故障信号时收敛过慢的问题,在大数据框架下提出一种改进的自适应滤波算法.以Hadoop平台为基础架构,构建一种三层次结构的机械故障大数据处理框架,用于采集和预处理原始故障大数据集;在信号滤波方面引入步长变化因子函数和均方误差函数,提高算法的收敛性能;基于离散粒子群算法对故障信号滤波处理过程进行优化,提高迭代速度和全局寻优的能力.实验结果表明:改进后的滤波算法降噪效果明显,尤其在低信噪比条件下其收敛性能相对于经典滤波算法更具优势.
-
-
吴华芹;
柳静;
谢妞妞
-
-
摘要:
笔者以基于Hadoop平台的电力行业大数据分析技术应用为研究对象,首先对电力用户侧大数据的特征进行了简单介绍,随后分析了基于Hadoop平台的大数据架构,最后对基于Hadoop平台的电力行业大数据分析技术应用过程进行了分析,以供参考。
-
-
和定繁;
蒋羽鹏;
杨珊;
陈贺
-
-
摘要:
为解决现有的智能变电站难以及时、有效地实现电力设备实时监测的问题,提出了一种面向智能变电站的电力设备状态监测方法.考虑到现有智能变电站电力设备数据量呈现指数增长,引入云计算运算模式,构建了基于Hadoop平台的MapReduce分布式处理系统.通过采用C4.5决策树算法实现了云计算,并基于MapReduce对算法进行改进.将并行算法作为核心优化Ha-doop平台的并行计算模式,实现数据的并行处理.实验结果表明,文中所提出的方法能够提升数据处理效率,增加电力设备故障诊断与识别的总体准确率,有效实现智能变电站电力设备的实时监测.
-
-
潘俊辉;
王辉;
张强;
王浩畅
-
-
摘要:
在文本分类过程中,经典的最近邻分类算法(KNN)面对海量数据时的执行时间较长.对经典KNN算法进行改进,通过在训练阶段构造初级分类器以减少训练阶段的计算量,并在Hadoop平台MapReduce下予以实现.实验结果表明,改进后的算法可以在保证分类精度的情况下节省运行时间.
-
-
Yunshu Li;
李耘书;
Fei Teng;
滕飞;
Tianrui Li;
李天瑞
- 《2018年全国高性能计算学术年会》
| 2018年
-
摘要:
Hadoop作为大规模分布式数据处理框架已经在工业界得到广泛的应用,优化Hadoop的性能一直是研究重点.面对Hadoop复杂的运行流程和庞大的参数空间,手动调优或基于经验调优充满了挑战,本论文基于Hadoop参数自动优化问题,提出一种优化问题的描述方法和分析框架,通过定义微操作解耦MapReduce运行过程,再利用微操作对其进行重构,建立参数和作业执行时间关系的模型.在此模型的基础上,可以应用各类搜索优化算法高效快速地搜索得出优化参数.通过实验发现,该方法高效准确,可移植性强,可以很好地完成参数自动优化,大幅提高作业执行效率,本论文的方法对terasort和wordcount两种类型作业的执行时间分别提高了至少41%和30%.
-
-
Yunshu Li;
李耘书;
Fei Teng;
滕飞;
Tianrui Li;
李天瑞
- 《2018年全国高性能计算学术年会》
| 2018年
-
摘要:
Hadoop作为大规模分布式数据处理框架已经在工业界得到广泛的应用,优化Hadoop的性能一直是研究重点.面对Hadoop复杂的运行流程和庞大的参数空间,手动调优或基于经验调优充满了挑战,本论文基于Hadoop参数自动优化问题,提出一种优化问题的描述方法和分析框架,通过定义微操作解耦MapReduce运行过程,再利用微操作对其进行重构,建立参数和作业执行时间关系的模型.在此模型的基础上,可以应用各类搜索优化算法高效快速地搜索得出优化参数.通过实验发现,该方法高效准确,可移植性强,可以很好地完成参数自动优化,大幅提高作业执行效率,本论文的方法对terasort和wordcount两种类型作业的执行时间分别提高了至少41%和30%.
-
-
Yunshu Li;
李耘书;
Fei Teng;
滕飞;
Tianrui Li;
李天瑞
- 《2018年全国高性能计算学术年会》
| 2018年
-
摘要:
Hadoop作为大规模分布式数据处理框架已经在工业界得到广泛的应用,优化Hadoop的性能一直是研究重点.面对Hadoop复杂的运行流程和庞大的参数空间,手动调优或基于经验调优充满了挑战,本论文基于Hadoop参数自动优化问题,提出一种优化问题的描述方法和分析框架,通过定义微操作解耦MapReduce运行过程,再利用微操作对其进行重构,建立参数和作业执行时间关系的模型.在此模型的基础上,可以应用各类搜索优化算法高效快速地搜索得出优化参数.通过实验发现,该方法高效准确,可移植性强,可以很好地完成参数自动优化,大幅提高作业执行效率,本论文的方法对terasort和wordcount两种类型作业的执行时间分别提高了至少41%和30%.
-
-
Yunshu Li;
李耘书;
Fei Teng;
滕飞;
Tianrui Li;
李天瑞
- 《2018年全国高性能计算学术年会》
| 2018年
-
摘要:
Hadoop作为大规模分布式数据处理框架已经在工业界得到广泛的应用,优化Hadoop的性能一直是研究重点.面对Hadoop复杂的运行流程和庞大的参数空间,手动调优或基于经验调优充满了挑战,本论文基于Hadoop参数自动优化问题,提出一种优化问题的描述方法和分析框架,通过定义微操作解耦MapReduce运行过程,再利用微操作对其进行重构,建立参数和作业执行时间关系的模型.在此模型的基础上,可以应用各类搜索优化算法高效快速地搜索得出优化参数.通过实验发现,该方法高效准确,可移植性强,可以很好地完成参数自动优化,大幅提高作业执行效率,本论文的方法对terasort和wordcount两种类型作业的执行时间分别提高了至少41%和30%.
-
-
-
-
-
-
康大维;
毛雪岷
- 《第十二届(2017)中国管理学年会》
| 2017年
-
摘要:
随着大数据与互联网技术发展,移动终端的数量不断增加,从而形成海量空间数据,空间数据的存储与分析已经成为当下研究的热点.传统方法无法存储与处理海量数据,并且中文处理能力欠佳.基于此,本文提出了基于云端Hadoop处理框架.该处理框架利用云端部署Hadoop集群,HBase存储,Lucene等技术建立了中文空间数据存储与检索处理流程,克服了地址查询、长字段查询等查询功能上的局限性.实验结果表明:基于云端hadoop海量空间数据存储与检索对处理中文数据有很强的优势.本文提出的处理框架,对于大数据环境下,海量空间数据的信息的检索与存储具有重要的启示.
-
-
康大维;
毛雪岷
- 《第十二届(2017)中国管理学年会》
| 2017年
-
摘要:
随着大数据与互联网技术发展,移动终端的数量不断增加,从而形成海量空间数据,空间数据的存储与分析已经成为当下研究的热点.传统方法无法存储与处理海量数据,并且中文处理能力欠佳.基于此,本文提出了基于云端Hadoop处理框架.该处理框架利用云端部署Hadoop集群,HBase存储,Lucene等技术建立了中文空间数据存储与检索处理流程,克服了地址查询、长字段查询等查询功能上的局限性.实验结果表明:基于云端hadoop海量空间数据存储与检索对处理中文数据有很强的优势.本文提出的处理框架,对于大数据环境下,海量空间数据的信息的检索与存储具有重要的启示.
-
-
-
-
- 北京航空航天大学
- 公开公告日期:2022.05.17
-
摘要:
本发明公开一种基于Hadoop平台的动态数据完整性验证方法、1、构建系统模型;2、数据拥有者产生一对密钥,包括私钥与公钥;3、数据拥有者将文件分块,为每个文件块生成文件块标签,将公钥(g,N)、文件块标签与文件上传至Hadoop平台;数据拥有者将公钥(g,N)与文件块标签发送给审计者;4、审计者生成挑战值,并发送给Hadoop平台;5、Hadoop平台根据挑战值生成证明值,并发送给审计者;6、审计者检查证明值,并将审计报告返回给数据拥有者;7、数据拥有者远程地对Hadoop平台上的数据进行更新,步骤7结束后,跳转到步骤4,重复执行步骤4至步骤6。本发明节省了文件传输的通信开销,提高了数据完整性验证的效率。
-
-
-
-
-
-
-