基于二维划分的杰卡德相似系数批量计算效率优化

廖彬; 张陶; 于炯; 国冰磊; 刘继

首页> 中文期刊> 《计算机科学》 >基于二维划分的杰卡德相似系数批量计算效率优化

基于二维划分的杰卡德相似系数批量计算效率优化

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

随着互联网用户及内容的指数级增长,大规模数据场景下的杰卡德相似系数计算对算法的效率提出了更高的要求.为提高算法的执行效率,对MapReduce架构下的算法执行缺陷进行了分析,结合Spark适用于迭代型及交互型任务的特点,基于二维划分算法将算法从MapReduce平台移植到Spark平台;并通过参数调整、内存优化等方法进一步提高了算法的执行效率.两组数据集分别在3组不同规模的集群上的实验结果表明,与MapReduce相比,Spark平台下的算法执行效率提高了4倍以上,能耗效率提升了3倍以上.%With the exponential growth of Internet users and content,the efficiency of the Jaccard's similarity coefficient algorithm under big data scenario is more important than ever before.In order to improve the efficiency of Jaccard's similarity computing process,the implementation that the algorithm was analyzed under MapReduce architecture.Combining the characteristics of the Spark is more suitable for the iterative and interactive tasks,we transformed the algorithm from the MapReduce platform to Spark based on two dimensional partition algorithm.And we improved the efficiency of the algorithm by parameter adjustment,memory optimization and other.methods.With two data sets running on 3 clusters with different number of datanodes,the experimental results show that,compared with MapReduce,the algorithrn execution efficiency under Spark platform improves more than 4 times,and energy efficiency improves more than 3 times.

著录项

来源
《计算机科学》 |2017年第1期|219-225|共7页
作者
廖彬; 张陶; 于炯; 国冰磊; 刘继;
展开▼
作者单位

新疆财经大学统计与信息学院乌鲁木齐830012;

新疆医科大学医学工程技术学院乌鲁木齐830011;

新疆大学软件学院乌鲁木齐8300083;

新疆大学软件学院乌鲁木齐8300083;

新疆财经大学统计与信息学院乌鲁木齐830012;

展开▼
原文格式 PDF
正文语种 chi
中图分类 TP393.09;
关键词
绿色计算; MapReduce; 任务调度; 温度感知;

相似文献

中文文献
外文文献
专利

1. 杰卡德相似系数在推荐系统中的应用 [J] . 张晓琳 ,付英姿 ,褚培肖 . 计算机技术与发展 . 2015,第004期
2. 基于改进的Jaccard相似系数矩阵的社团划分算法 [J] . . 南京邮电大学学报（自然科学版） . 2018,第006期
3. 基于二维特征相似系数的雷达辐射源识别算法 [J] . 王鑫 ,王旭 ,洪伟 . 舰船电子对抗 . 2020,第005期
4. 基于SURF特征描述符和杰卡德距离的文物碎片拼接 [J] . 刘晓宁 ,狄宏璋 ,杨稳 . 光学精密工程 . 2020,第004期
5. 基于非对称多值特征杰卡德系数的高维语义向量差异性度量方法 [J] . 冯艳红 ,于红 ,孙庚 . 计算机科学 . 2018,第006期
6. 用于提高二维光栅问题计算效率的群论方法 [C] . 白本锋 ,李立峰 . 中国光学学会2004年学术大会 . 2004
7. 基于杰卡德相似系数与协作定位的DV-Hop定位算法的研究 [A] . 杨庚 . 2019

基于二维划分的杰卡德相似系数批量计算效率优化

摘要

著录项

相似文献

相关主题

期刊订阅