首页> 中文学位 >基于YARN框架下决策树算法的并行化研究
【6h】

基于YARN框架下决策树算法的并行化研究

代理获取

目录

第一个书签之前

ABSTRACT

第1章 绪论

1.1 选题背景及研究意义

1.2 国内外研究现状

1.3 本文的研究内容

1.4论文的组织

第2章 决策树算法的研究

2.1 数据挖掘概念

2.2 分类的概念及算法描述

2.2.1 分类概念

2.2.2 常见的分类算法

2.2.3 评估分类器性能的度量

2.3 决策树算法的基本过程

2.3.1 数据预处理

2.3.2 特征选择

2.3.3 决策树生成

2.3.4 剪枝

2.4 经典决策树算法的分析与比较

2.4.1 ID3算法

2.4.2 C4.5算法

2.4.3 CART算法

2.4.4 大规模数据集的决策树算法

2.4.5 决策树算法评价

2.5 本章小结

第3章 并行化框架

3.1 MapReduce

3.1.1 MapReduce编程模型

3.1.2 MapReduce实现原理

3.1.3 MapReduce架构经典实例

3.2 YARN

3.2.1 YARN框架原理

3.2.2 YARN工作流程

3.3 YARN和Hadoop 1.0对比分析

3.3.1 体系结构对比

3.3.2 运算框架对比

3.4 本章小结

第4章 C4.5算法的优化及其在YARN框架下的并行化实现

4.1 决策树算法的并行化设计

4.1.1 属性并行

4.1.2连续属性离散化并行

4.1.3 节点并行

4.1.4剪枝并行

4.2 C4.5算法的优化

4.2.1引入权重系数

4.2.2简化信息增益率的计算

4.2.3 C4.5_YH算法描述

4.3 C4.5_YH算法的并行化实现

4.4 本章小结

第5章 实验过程及结果分析

5.1实验平台

5.1.1 环境准备

5.1.2 YARN的安装和配置

5.2 并行算法的性能评价标准

5.3 实验验证与分析

5.4 本章小结

第6章 总结与展望

6.1本文总结

6.2展望未来

致 谢

参考文献

攻读学位期间的研究成果

展开▼

著录项

  • 作者

    姜如霞;

  • 作者单位

    南昌大学;

  • 授予单位 南昌大学;
  • 学科 计算机科学与技术
  • 授予学位 硕士
  • 导师姓名 黄水源;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类
  • 关键词

    框架; 决策树算法;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号