首页> 中文学位 >N-δ滑动窗口模型下的优化数据流聚类算法
【6h】

N-δ滑动窗口模型下的优化数据流聚类算法

代理获取

目录

文摘

英文文摘

声明

第一章引言

1.1研究背景

1.1.1数据挖掘

1.1.2聚类算法

1.1.3算法模型

1.2研究现状

1.2.1问题模型

1.2.2流数据聚类算法研究现状

1.2.3流数据聚类算法研究的目的及意义

1.3本文工作

1.4内容组织

第二章流数据挖掘

2.1流数据及其特点

2.2流数据挖掘与传统数据挖掘比较

2.2.1流数据挖掘

2.2.2流数据挖掘与传统数据挖掘过程对比

2.3流数据挖掘模型

2.3.1基于界标模型(1andmark model)的方法

2.3.2基于滑动窗口模型(sliding window model)的方法

2.4流数据聚类模型发展与应用

2.4.1 CluStream数据流聚类算法

2.4.2流数据聚类模型应用

2.5本章小结

第三章N-δ滑动窗口模型下的优化聚类算法

3.1基本理论

3.1.1数据流聚类

3.1.2聚类分析中的混合类型变量

3.2问题提出

3.3N-δ模型下的算法结构

3.3.1优化指数直方图

3.3.2优化聚类特征结构

3.3.3微簇

3.3.4聚类特征指数直方图的合并

3.3.5N-δ滑动窗口模型

3.4N-δ窗口模型下的优化聚类算法

3.4.1数据流挖掘对聚类的要求

3.4.2 OpClAlg优化算法设计

3.5本章小结

第四章算法实现

4.1算法结构

4.4.1计算分类

4.4.2 OTCF结构维护过程

4.2算法实现

4.2.1实验工具

4.2.2数据准备

4.2.3算法实现

4.3算法效率分析

4.4本章小节

第五章数据流聚类算法在电信中的应用

5.1电信背景

5.1.1电信现状

5.1.2客户分析

5.1.3商业理解

5.2应用模型设计

5.3本章小结

第六章结论与展望

6.1工作总结

6.2展望

参考文献

致谢

攻读学位期间发表的学术论文目录

展开▼

摘要

本文主要做了以下工作: (1)在CluStream算法基础上从三个方面定义了算法结构,即:计算分类,合并及维护OTCF结构,聚类结果三个过程。首先定义了OTCF结构,优化了已有的算法聚类特征结构。通过引入参数t*,定义了在对多维流数据处理时需要处理过期数据的淘汰机制,通过计算参数t*对即将到达的数据流进行实时的处理,并对已过期的数据进行淘汰,从而释放内存空间,堤高算法的内存使用率及处理效率。 (2)在数据流处理过程中定义了一种N-δ窗口模型,滑动窗口处理机制中窗口大小可以随着参数δ的不同而改变。最后,在此基础上改进了基于滑动窗口模型的优化数据流聚类算法,从而高效应用于实时数据流模型中,并广泛地应用于诸领域中。 (3)实验数据采用某电信公司的部分数据,使用Java程序设计语言以及SQL Server数据库实现了算法,并分析了算法处理结果。 聚类结果表明基于N-δ滑动窗口模型下的优化算法降低了算法复杂度,提高了内存使用率,并获得了比较准确的聚类质量。理论分析及实验表明,滑动窗口模型下的数据流优化聚类算法提高了计算速度,在聚类质量上优于界标模型下的算法。同时,在计算复杂度上优于现有的一些算法。将其应用于数据流诸多领域中,可在很大程度上提高其工作效率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号