首页> 中文期刊> 《天津科技》 >基于Hadoop云计算平台的文本处理算法的研究与改进

基于Hadoop云计算平台的文本处理算法的研究与改进

             

摘要

Hadoop is an open source distributed computing platform under Apache Foundation.Taking HDFS(Hadoop Distributed File System)and MapReduce distributed computing framework as the core,it provides users with details of transparent distributed cloud infrastructure of the lower tier.Based on an in-depth analysis and study of Hadoop,a Hadoop-based cloud computing platform was established and distributed text file processing tasks and algorithms were completed.%Hadoop是Apache基金会下的一个开源分布式计算平台,以分布式文件系统HDFS(Hadoop Distributed File System)和MapReduce分布式计算框架为核心,为用户提供了底层细节透明的云分布式基础设施.在对Hadoop进行深入分析和研究的基础上,搭建基于 Hadoop 的云计算平台,并完成分布式文本文件处理任务以及对文件文本内容处理算法的改进和实现.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号