首页> 中文学位 >基于网格的加权平均密度自适应聚类算法及其应用研究
【6h】

基于网格的加权平均密度自适应聚类算法及其应用研究

代理获取

目录

声明

摘要

第1章 绪论

1.1 研究背景与意义

1.2 国内外研究进展及现状

1.2.1 聚类算法研究进展及现状

1.2.2 基于网格聚类算法研究进展及现状

1.3 论文研究内容及组织结构

1.3.1 论文研究内容

1.3.2 论文组织结构

第2章 网格聚类算法综述

2.1 数据挖掘概述

2.1.1 数据挖掘定义

2.1.2 数据挖掘所发现的知识

2.1.3 数据挖掘功能

2.1.4 数据挖掘系统组成及其挖掘过程

2.2 聚类分析基础

2.2.1 聚类分析定义

2.2.2 聚类分析应用要求

2.2.3 聚类分析常用算法

2.3 基于网格的聚类算法

2.3.1 传统网格聚类算法

2.3.2 几种改进网格聚类算法

2.4 小结

第3章 网格划分及边界点提取

3.1 网格划分类型

3.1.1 均匀网格划分

3.1.2 边长自适应网格划分

3.1.3 区域自适应网格划分

3.1.4 3种网格划分方法之比较

3.2 网格边界点提取

3.2.1 窗口延伸法

3.2.2 k-近邻延伸法

3.3 小结

第4章 基于网格的加权平均密度自适应聚类算法

4.1 加权平均密度相关概念

4.2 自适应容纳阈值相关概念

4.3 网格划分方法

4.3.1 基本概念

4.3.2 网格分割

4.4 聚类边界点提取

4.5 算法基本思想

4.6 小结

第5章 算法实现及在入侵检测中的应用

5.1 算法描述

5.2 仿真实例

5.2.1 有效性

5.2.2 参数变化对聚类结果的影响

5.2.3 时间性能测试

5.3 改进算法与SCI算法之比较

5.3.1 簇不相连数据集聚类结果比较

5.3.2 簇相连数据集聚类结果比较

5.4 改进算法在入侵检测中的应用

5.5 小结

结论

参考文献

致谢

展开▼

摘要

聚类分析是数据挖掘领域中的一项重要内容,也是研究的热点。聚类分析能够发现数据的内在分布,也可以作为数据预处理技术,如离群点检测等。聚类分析被广泛用于信息检索、趋势分析、遥感图像等。
   本文在深入研究聚类分析中的网格划分及边界点提取问题的基础上,提出加权平均密度和自适应容纳阈值概念。然后以这两个概念为基础,对基于网格的密度聚类算法的网格划分方法、聚类边界点提取方法和算法基本思想加以改进,构造基于网格的加权平均密度自适应聚类算法。
   本文的主要研究内容如下。
   (1)阐述了数据挖掘含义;论述了数据挖掘所发现的知识、数据挖掘功能、数据挖掘系统组成及其挖掘过程。在此基础上,讨论了聚类分析的基本含义、应用要求和常用算法。分析了传统网格聚类算法和几种改进网格聚类算法的网格划分方法、算法基本思想和各自的优缺点。
   (2)根据聚类过程中网格尺度变化方式,提出了将网格划分分为均匀网格划分、边长自适应网格划分和区域自适应网格划分的一种新的网格划分分类方法,分析了这3种网格划分方法各自特点并进行了相互比较;根据聚类过程中两种不同密度计算方式,提出了将边界点提取方法分为窗口延伸法和k-近邻延伸法的一种新的边界点提取分类方法。分析了这2种边界点提取方法各自特点并进行了相互比较。
   (3)提出了加权平均密度和自适应容纳阈值概念。然后以这两个概念为基础,对基于网格的密度聚类算法的网格划分方法、聚类边界点提取方法和算法基本思想加以改进,构造了基于网格的加权平均密度自适应聚类算法。
   (4)在构造基于网格的加权平均密度自适应聚类算法的算法步骤的基础上,对该算法进行了实验仿真,包括有效性验证、参数变化对聚类结果具有影响的例证、时间性能测试。然后将改进算法与SCI算法对簇不相连数据集聚类结果及簇相连数据集聚类结果进行了比较,验证了改进算法能降低参数敏感性、提高聚类准确率、提升簇相连数据集聚类的有效性。最后将改进算法应用于入侵检测中,证明了改进算法对网络入侵数据集的聚类有较高的准确率。
   最后,对本文的工作进行了总结并对今后可能的研究方向进行了展望。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号