首页> 中文学位 >多维数据集聚类算法研究与实现
【6h】

多维数据集聚类算法研究与实现

代理获取

目录

文摘

英文文摘

独创性说明及关于论文使用授权的说明

1绪论

1.1课题背景及选题意义

1.2国内外研究现状概述

1.3论文的主要内容

2数据挖掘技术中的聚类分析

2.1数据挖掘技术

2.1.1数据挖掘的定义

2.1.2数据挖掘的分类

2.1.3数据挖掘和数据库中知识发现的区别

2.1.4数据挖掘过程

2.2聚类分析相关技术

2.2.1聚类分析的定义

2.2.2聚类分析的分类

2.2.3聚类分析的相关技术

2.2.4聚类分析的研究方向

2.2.5聚类分析的应用

3主要代表算法研究

3.1硬聚类算法

3.1.1基于距离的聚类算法

3.1.2基于划分的聚类算法

3.1.3基于距离演化的聚类算法

3.2软聚类算法

3.2.1基于欧氏距离的模糊C-球壳聚类算法

3.2.2模糊C-球壳聚类算法的性能分析

3.2.3基于距离修正的模糊C-球壳聚类算法

3.3可能性聚类算法

3.3.1可能性理论及其性质

3.3.2可能性匹配

3.3.3可能性聚类分析

4基于划分的新算法实现

4.1算法的核心思想

4.2算法的相关知识

4.3算法的基本原理

4.4算法的主要步骤

4.4.1算法描述

4.4.2算法步骤

4.5算法的具体实现

4.6新算法与经典划分算法的对比

4.6.1两种聚类算法的性能对比

4.6.2两种聚类算法的性能分析

4.7实验结果

结 论

参考文献

在学研究成果

致 谢

展开▼

摘要

聚类分析在数据挖掘理论和应用中都是一个非常必要的部分,是一种数据划分或分组处理的重要手段和方法.到目前为止,已有大量的数据挖掘聚类算法被提出来,其中很多聚类算法都有非常成功的应用.但是,它们主要继承多元统计分析学和模糊数学的结论,即主要是基于距离和阈值的各种聚类算法和改进算法.很多时候需要人为干预,需要行业知识、领域专家等因素的介入,大多数算法对混合型属性数据力不从心.尤其在商务决策、市场分析、刑侦破案、知识发现、生物学、Web文档分类等领域,需要新的适合于混合型属性数据的聚类算法,该课题就是在此背景下被提出来.论文首先研究了具有代表性几种多维聚类算法,比如,硬聚类划分、软聚类划分和可能性聚类.这些算法一般最终都必须引入一个阈值才能确定类别,而实际上,这种阈值往往没有一个标准,这为用户增加了灵活性,但也增大了它的随意性,这正是此类算法的缺点所在.为此,提出了新的基于划分的聚类算法,该算法基于这样的核心思想:具有许多相同主要属性的有效集合是比较相近的,大致可以划分一类,即

著录项

  • 作者

    王海;

  • 作者单位

    沈阳工业大学;

  • 授予单位 沈阳工业大学;
  • 学科 计算机应用技术
  • 授予学位 硕士
  • 导师姓名 许占文;
  • 年度 2004
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.13;
  • 关键词

    数据挖掘; 聚类分析; 划分; 可能性聚类; 半模糊化聚类;

  • 入库时间 2022-08-17 10:15:52

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号