首页> 中文学位 >基于Rough集的层次聚类算法研究及应用
【6h】

基于Rough集的层次聚类算法研究及应用

代理获取

目录

文摘

英文文摘

第一章 绪论

1.1 论文选题背景

1.2 层次聚类算法的研究现状

1.3 Rough集研究现状

1.4 论文主要工作

1.5 论文组织结构

第二章 相关理论基础

2.1 集合论基础

2.2 Rough集理论的基本概念

2.2.1 信息系统

2.2.2 不可分辨关系

2.2.3 可分辨矩阵

2.2.4 信息熵

2.2.5 相容关系

2.3 聚类分析概述

2.3.1 聚类的概念

2.3.2 聚类过程

2.3.3 聚类的数据类型

2.3.4 相似性度量

2.3.5 主要的聚类算法

2.3.6 聚类算法的选择

2.3.7 聚类算法的评价标准

2.4 本章小结

第三章 基于Rough集扩展模型的层次聚类算法

3.1 引言

3.2 相关定义

3.2.1 和谐关系与和谐度

3.2.2 层次聚类相关定义

3.3 基于Rough集扩展模型的层次聚类算法

3.3.1 算法框架概述

3.3.2 算法描述

3.3.3 实例分析

3.4 仿真实验

3.4.1 测试平台和测试数据

3.4.2 实验1

3.4.3 实验2

3.4.4 实验3

3.5 本章小结

第四章 聚类技术在Web用户挖掘中的应用

4.1 引言

4.2 Web用户挖掘

4.3 数据预处理

4.4 用户浏览行为和Web站点表示

4.5 基于ERSHC算法的Web用户聚类

4.5.1 相似性的度量

4.5.2 Web用户聚类算法

4.6 用户聚类实例分析

4.6.1 实例介绍

4.6.2 实例测试

4.7 实验结果及分析

4.7.1 实验环境

4.7.2 结果对比

4.8 本章小结

第五章 总结及未来的工作

5.1 总结

5.2 未来的工作

致谢

攻硕期间从事的科研工作及取得的研究成果

参考文献

展开▼

摘要

随着信息技术的发展,数据挖掘技术得到了广泛的关注。在数据挖掘技术中有很多研究领域,聚类分析是数据挖掘的一个非常活跃的研究方向,有着重要的理论意义和应用价值。目前在文献中存在大量的聚类算法,算法的选择取决于数据的类型,聚类的目的和应用。聚类算法具体可以分为划分方法,层次方法,基于密度的方法,基于网格的方法,以及基于模型的方法等。
   在中、小规模的数据聚类应用中,层次聚类算法不仅适合用于任意属性和任意形状的数据集,还可以灵活控制不同层次的聚类粒度,因此具有较强的聚类能力。而传统的凝聚层次聚类算法大部分只能处理数值属性数据,本文针对字符型数据和混合型数据的聚类方法进行了研究。
   首先,在经典粗糙集(又称Rough集)理论的基础上,通过松弛对象之间的不可分辨和相容性条件,得到了基于和谐关系的扩展粗糙集模型。该方法有别于传统凝聚层次聚类算法中广泛应用的距离方法,采用和谐度的定义,有效地解决了混合属性对象间的相似性度量问题。
   其次,重新定义了个体间不可区分度、类间不可区分度、聚类结果的综合近似精度等概念,提出了一种新的混合数据类型层次聚类算法。该算法不仅能处理数值型数据,而且能处理大多数聚类算法不能处理的字符型数据和混合型数据。实验验证了算法的可行性。
   最后,结合Web用户的行为模型,将新的层次聚类算法应用于Web用户挖掘中,提出了一种新的Web用户聚类算法。该算法综合考虑了Web用户浏览行为中的浏览时间和浏览频率,提高了Web用户挖掘的准确度。实验证明该算法比单纯考虑时间或单纯考虑频率的算法具有更好的聚类结果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号