首页> 中文会议>第九届中国通信学会学术年会 >一种基于Hadoop平台的海量Web数据挖掘系统研究与实现

一种基于Hadoop平台的海量Web数据挖掘系统研究与实现

摘要

针对目前Web数据规模的快速增长,传统的基于单机的数据挖掘模式不能胜任当前Web海量数据存储与处理.随着“云计算”技术的兴起,将传统的数据挖掘方法与“云计算”平台融合以提高数据挖掘的效率成为一种研究方向.本文将传统的遗传算法与Hadoop的MapReduce进行融合,针对Hadoop的分布式文件存储系统HDFS中的海量Web数据进行挖掘.为进一步验证该平台的高效性,在该平台上利用融合后的算法挖掘Web日志中用户的偏爱访问路径.实验结果表明,在Hadoop中运用分布式算法处理大量的Web数据,可以明显提高Web数据挖掘的效率.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号