文摘
英文文摘
一.引言
1、 背景
2、 工具研究现状
(1)部分产品比较
(2)工具/产品特点
(3)工具应用
3、 意义
4、 研究来源和目标
二.文献综述
1、 数据仓库
2、 OLAP和多维分析
3、 知识发现过程
(1)定义问题:
(2)创建、清理数据和数据预处理:
(3)数据挖掘
(4)模型确认
(5)模式解释
(6)规则监护
4、 有关数据的基本概念
5、 数据挖掘基本技术
(1)关联(association)和序贯模型(sequencing)
(2)分类(classification)和回归(regression)
(3) 聚类(clustering)
(4)决策树/判定树(Decision Tree)
(5) Naive-Bayes
(6)神经网络(Neural Net)
(7)遗传算法(Genetic Algorithms)
三.数据挖掘工具的核心:算法库的研究与实现——DMC++
1、 算法类库介绍
(1) 术语
(2)主要算法
2、 类结构
3、 实现
(1)实现技术
(2) 经验和教训
4、DMC++的应用
(1)数据挖掘工具: DMTOOLS
(2)数据挖掘应用:社会保险示范项目
5、 小结
四.数据挖掘工具使用的研究:结合数据聚类处理的KNN算法
1、 引言
2、 K个最近邻居(K-NEAREST NEIGHBOR)
(1) 概述
(2)基本概念
(3)算法
(4) 实现
(5) 评价
3、 KNN与聚类算法
4、 扩展的KNN算法
5、 结果的研究
6、 小结
五.体现过程可视化的数据挖掘工具研究与设计
1、 功能层次
2、 功能结构
3、 节点结构
4、 设计技术
(1) 参考SAS/EM2
(2)面向对象技术
(3)基本组件库
(4)使用TOOLKIT把C语言写的算法加入SAS系统里
5、 过程可视化的研究
6、 应用方案:数据挖掘/数据仓库在辽宁连通
(1) 目标
(2) 设计原则
(3)系统结构
(4)业务模型
(5)产品方案
六.结束语
1、 结论
2、 下一步研发设想
参考文献
致谢