首页> 中文学位 >基于概率密度网格结构的不确定数据流聚类算法研究
【6h】

基于概率密度网格结构的不确定数据流聚类算法研究

代理获取

目录

声明

第1章 绪 论

1.1 不确定数据流挖掘技术

1.2 不确定数据流聚类分析研究现状

1.3 课题的主要研究内容

1.4 本文的结构安排

第2章 基于概率密度网格结构的不确定数据流在线聚类算法研究

2.1 引言

2.2 问题定义

2.3 PDG-OCUStream聚类算法设计

2.4 本章小结

第3章 基于可调整的概率密度网格结构的不确定数据流聚类算法研究

3.1 引言

3.2 问题定义

3.3 APDG-CUStream算法设计

3.4 本章小结

第4章 基于概率密度网格树的不确定数据流聚类算法研究

4.1 引言

4.2 问题定义

4.3 PDGT-CUStream算法设计

4.4 本章小结

第5章 算法实现及性能分析

5.1 实验数据和实验环境

5.2 PDG-OCUStream算法性能分析

5.3 APDG-CUStream算法性能分析

5.4 PDGT-CUStream算法性能分析

5.5 本章小结

结论

参考文献

攻读硕士学位期间承担的科研任务与主要成果

致谢

作者简介

展开▼

摘要

近年来,国内外学者对不确定数据流的聚类问题进行了大量的研究,但仍有不少问题尚待解决。大多数不确定数据流聚类算法不能在线得到精确的聚类结果;现有算法采用固定划分网格的方法,不能有效处理边界点;已有基于网格的算法,对概率密度网格单元缺少有效的存储结构。这些问题的研究对于不确定数据流的聚类分析以及在具体领域的应用都具有重要的意义。
  首先,为了实现对不确定数据流的在线聚类,提出了一种基于概率密度网格结构的不确定数据流聚类算法。该算法采用计数型滑动窗口,以反映不确定数据流的当前情况。同时,采用概率密度网格的存储结构,以使算法能够发现任意形状的簇。另外,还定义网格概率密度相似度,以实现初始化及更新聚类,提高算法的实时性。
  其次,为了更好地处理边界点问题,提出了一种基于可调整的概率密度网格结构的不确定数据流聚类算法。该算法采用可调整的概率密度网格技术来处理稀疏网格单元,以提高聚类质量。同时,还定义概率密度网格聚类特征用以存储不确定数据流的概要信息。另外,在概率密度的定义中引入时间衰减因子,以降低历史数据对聚类结果的影响。
  最后,为了有效存储网格单元,提出了一种基于概率密度网格树的不确定数据流聚类算法。该算法将一种树型概要数据结构引入到不确定数据流聚类算法中。首先把不确定元组按其属性值分配到一棵多叉树中,以消除空网格对聚类结果的影响。同时,设置时间间隔,以提高算法的执行效率。另外,还引入噪音阈值函数,以有效发现噪音叶子节点。
  本文通过实验对上述提出的算法进行验证,并与已有经典算法进行比较分析。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号