文摘
英文文摘
第一章 引言
1.1 课题背景
1.2 研究目的和意义
1.3 国内外研究现状
1.4 论文研究内容及章节安排
1.5 本章小结
第二章 云计算平台介绍与浅析
2.1 Google云计算平台介绍与分析
2.1.1 Google文件系统GFS
2.1.2 Google的Bigtable
2.1.3 MapReduce编程模型
2.2 开源云计算平台Hadoop介绍与分析
2.2.1 Hadoop分布式文件系统概述
2.2.2 Hadoop分布式文件系统(HDFS)详解
2.2.3 MapReduce并行编程模型在Hadoop中的实现
2.2.4 Hadoop Map/Reduce的容错机制分析
2.3 Sector架构分析与介绍
2.3.1 Sector概述
2.3.2 Sector文件系统管理
2.4 Security server
2.4.1 Sphere计算云
2.4.2 调度机制
2.5 平台应用背景的对比
2.5.1 GFS、MapReduce和Bigtable应用场景
2.5.2 Hadoop应用场景
2.5.3 Sector/Sphere应用场景
2.6 Google云平台、Sector/Sphere及Hadoop平台的对比
2.7 本章小结
第三章 基于网络日志的中文热点话题提取算法研究
3.1 话题提取算法介绍与分析
3.2 基于网络日志的热点话题提取算法分析
3.3 基于网络日志的热点话题提取方法
3.3.1 网络日志分析
3.3.2 主题提取
3.3.3 热点话题提取
3.3.4 热点话题描述
3.4 单机实验和分析
3.4.1 单机实验结果及分析
3.4.2 中文热点提取算法展望
3.5 中文热点提取算法的MapReduce化
3.5.1 网页统计MapReduce化
3.5.2 网页爬取、网页解析及主题提取MapReduce化
3.5.3 候选话题提取MapReduce化
3.5.4 热点话题描述MapReduce化
3.6 Hadoop云计算集群上实验结果与分析
3.6.1 Hadoop实验集群的搭建
3.7 Hadoop集群上的实验结果与分析
3.7.1 Hadoop集群与单机实验结果与分析
3.7.2 Hadoop集群线性比测试与分析
3.8 本章小结
第四章 基于用户的协同过滤算法在Hadoop平台的实现
4.1 协同过滤算法简介
4.2 协同过滤系统详解
4.2.1 假设与目标
4.2.2 协同过滤算法具体过程
4.2.3 传统协同过滤算法面临的问题及应对策略
4.3 传统协同过滤算法的MapReduce化
4.3.1 数据划分
4.3.2 Map阶段
4.3.3 Reduce阶段
4.4 协同过滤算法实验过程及结果分析
4.4.1 实验总结与展望
4.5 本章小结
第五章 局部加权线性回归算法在Hadoop平台的实现
5.1 局部加权线性回归算法简介
5.2 局部加权线性回归算法详解
5.2.1 局部加权线性回归算法主要步骤
5.3 局部加权线性回归算法的MapReduce化
5.3.1 Datanode数据量的划分
5.3.2 Map阶段
5.3.3 Reduce阶段
5.4 实验过程及测试结果分析
5.5 本章小结
第六章 朴素贝叶斯分类算法在Hadoop平台的实现
6.1 朴素贝叶斯算法简介
6.2 朴素贝叶斯算法详解
6.2.1 贝叶斯定理
6.2.2 算法实现的疑难与解答
6.2.3 朴素贝叶斯算法实现过程
6.3 朴素贝叶斯算法的MapReduce化
6.3.1 数据预处理M印Reduce化
6.3.2 模型训练MapReduce化
6.3.3 分类MapReduce化
6.4 实验过程及测试结果分析
6.5 本章小结
第七章 总结和展望
致谢
参考文献
攻硕期间取得的研究成果