首页> 中文学位 >体现过程可视化的数据挖掘工具的研究与实现
【6h】

体现过程可视化的数据挖掘工具的研究与实现

代理获取

目录

文摘

英文文摘

一.引言

1、 背景

2、 工具研究现状

(1)部分产品比较

(2)工具/产品特点

(3)工具应用

3、 意义

4、 研究来源和目标

二.文献综述

1、 数据仓库

2、 OLAP和多维分析

3、 知识发现过程

(1)定义问题:

(2)创建、清理数据和数据预处理:

(3)数据挖掘

(4)模型确认

(5)模式解释

(6)规则监护

4、 有关数据的基本概念

5、 数据挖掘基本技术

(1)关联(association)和序贯模型(sequencing)

(2)分类(classification)和回归(regression)

(3) 聚类(clustering)

(4)决策树/判定树(Decision Tree)

(5) Naive-Bayes

(6)神经网络(Neural Net)

(7)遗传算法(Genetic Algorithms)

三.数据挖掘工具的核心:算法库的研究与实现——DMC++

1、 算法类库介绍

(1) 术语

(2)主要算法

2、 类结构

3、 实现

(1)实现技术

(2) 经验和教训

4、DMC++的应用

(1)数据挖掘工具: DMTOOLS

(2)数据挖掘应用:社会保险示范项目

5、 小结

四.数据挖掘工具使用的研究:结合数据聚类处理的KNN算法

1、 引言

2、 K个最近邻居(K-NEAREST NEIGHBOR)

(1) 概述

(2)基本概念

(3)算法

(4) 实现

(5) 评价

3、 KNN与聚类算法

4、 扩展的KNN算法

5、 结果的研究

6、 小结

五.体现过程可视化的数据挖掘工具研究与设计

1、 功能层次

2、 功能结构

3、 节点结构

4、 设计技术

(1) 参考SAS/EM2

(2)面向对象技术

(3)基本组件库

(4)使用TOOLKIT把C语言写的算法加入SAS系统里

5、 过程可视化的研究

6、 应用方案:数据挖掘/数据仓库在辽宁连通

(1) 目标

(2) 设计原则

(3)系统结构

(4)业务模型

(5)产品方案

六.结束语

1、 结论

2、 下一步研发设想

参考文献

致谢

展开▼

摘要

DMC++是研究人员在项目中首先建立的数据挖掘的算法类库.在先介绍DMC++的基本内容后,作者介绍子有关实现的技术和在这个项目中的经验和教训.结合聚类处理的KNN算法提出了利用聚类算法对样本集预先进行分类处理的KNN算法,聚类和分类算法结合,减少分类时的计算工作量,并在保留原有算法的优点的同时克服原有算法缺点.OpenMiner1.0是研究人员目前正在开发的数据挖掘工具产品.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号