文摘
英文文摘
声明
第一章序论
1.1选题依据及意义
1.2数据挖掘研究的理论基础
1.3基于数据流模型的数据挖掘算法
1.4本论文的主要研究内容和组织结构
1.4.1主要研究内容
1.4.2本论文的组织
第二章相关概念与技术
2.1数据流模型及其处理模型
2.1.1数据流模型
2.1.2数据流处理模型
2.2数据流管理系统及挖掘算法研究现状
2.2.1数据流管理系统
2.2.2数据流挖掘算法
2.3聚类分析
2.3.1聚类分析的定义
2.3.2聚类分析的主要方法
2.3.3基于静态数据集的聚类分析研究现状
2.3.4基于数据流数据的聚类分析研究现状
2.4离群点检测
2.4.1离群点的定义
2.4.2离群点检测的主要方法
2.4.3基于静态数据集的离群点检测研究现状
2.4.4基于数据流数据的离群点检测研究现状
2.5维数灾难
2.5.1高维数据对聚类分析的影响
2.5.2高维数据对离群点检测的影响
2.5.3降维处理
2.6数据索引结构
2.7概要数据结构生成方法
2.8本章小结
第三章高维数据流子空间聚类发现及维护
3.1相关工作
3.2相关概念与结论
3.2.1网格单元与选择度
3.2.2 Hoeffding界
3.3 SHStream算法
3.3.1子空间聚类发现算法
3.3.2子空间聚类维护算法
3.4算法性能分析与实验结果
3.4.1复杂度分析
3.4.2实验结果
3.5本章小结
第四章高维数据流聚类演化分析
4.1 CEA-Stream算法及其构造
4.1.1主要思路
4.1.2相关概念
4.1.3在线网格单元统计
4.1.4离线聚类演化分析
4.2算法性能分析与实验结果
4.2.1复杂度分析
4.2.2实验结果
4.3本章小结
第五章基于时间相关滑动窗口的高维数据流聚类
5.1问题描述及相关定义
5.2 CluHSWin算法及其构造
5.2.1时间相关滑动窗口
5.2.2主要思路
5.2.3网格单元信息的保存
5.2.4 CluHSWin的构造
5.3算法性能分析与实验结果
5.3.1复杂度分析
5.3.2实验结果
5.4本章小结
第六章基于频繁模式的高维类别属性数据流离群点检测
6.1相关工作
6.2问题描述及相关定义
6.3 FODFP-Stream算法及其构造
6.3.1动态发现和维护频繁模式
6.3.2 FODFP-Stream算法
6.3.3讨论
6.4算法性能分析与实验结果
6.4.1复杂度分析
6.4.2实验结果
6.5本章小结
第七章分布环境下的高维类别属性数据流离群点检测
7.1相关工作
7.2问题描述及相关定义
7.3 FOD-DStream算法及其构造
7.3.1分布站点上的局部频繁模式发现与维护
7.3.2中心站点上的全局频繁模式发现与维护
7.3.3离群点检测
7.3.4分布站点与中心站点的交互
7.4算法性能分析与实验结果
7.4.1复杂度分析
7.4.2实验结果
7.5本章小结
第八章总结和展望
8.1本文工作的总结
8.2进一步的研究工作
致谢
参考文献
攻读博士期间发表相关文章列表