首页> 中文学位 >Web事务聚类中模糊聚类算法的应用研究
【6h】

Web事务聚类中模糊聚类算法的应用研究

代理获取

目录

文摘

英文文摘

声明

第1章绪论

1.1课题背景

1.2论文的研究内容及组织

1.2.1论文的主要研究内容

1.2.2论文的组织

第2章数据挖掘及Web挖掘概述

2.1数据挖掘

2.1.1数据挖掘定义

2.1.2数据挖掘的过程

2.1.3数据挖掘的技术

2.2 Web挖掘

2.2.1 Web挖掘概述

2.2.2 Web日志挖掘及相关概念

第3章 Web站点日志数据预处理

3.1 Web日志数据预处理的必要性

3.1.1 Web访问日志格式

3.1.2访问日志预处理的必要性

3.2 Web日志数据预处理过程

3.2.1数据净化

3.2.2用户识别

3.2.3会话识别

3.2.4路径补充

3.2.5事务识别

第4章聚类分析

4.1聚类分析的定义

4.2聚类算法的要求

4.3主要聚类算法的分类

4.3.1划分方法(partitioning method)

4.3.2层次方法(hierarchical method)

4.3.3基于密度的方法(density-based method)

4.3.4基于网格的方法(grid-based method)

4.3.5基于模型的方法(model-based method)

4.3.6模糊聚类方法(Fuzzy Clustering)

第5章模糊聚类算法

5.1模糊数学的研究现状及发展

5.2模糊集相关理论

5.2.1模糊集合的概念

5.2.2模糊集合的表示法

5.2.3模糊集的运算及其性质

5.3模糊等价关系

5.3.1自反性、对称性与传递性

5.3.2模糊等价关系与聚类图

5.4模糊相似关系与传递闭包

5.5模糊聚类分析

5.5.1数据预处理

5.5.2基于模糊等价关系的聚类方法

第6章 Web事务模糊聚类算法

6.1算法模型

6.2算法描述

6.2.1从Web日志生成Web事务集合

6.2.2用户浏览时间的离散化表示方法

6.2.3 Web站点用户访问矩阵表示及数据标准化

6.2.4构建模糊相似矩阵

6.2.5模糊相似矩阵的t-bridge等价闭包求法

6.2.6采用λ截矩阵法进行模糊聚类分析

6.3算法举例及试验分析

6.3.1算法举例

6.3.2算法试验分析

第7章结论

7.1总结

7.2进一步的工作

参考文献

攻读学位期间公开发表论文

致谢

研究生履历

展开▼

摘要

Internet的迅猛发展,尤其是Web的全球普及,使得Web上信息量无比丰富。通过对Web的挖掘,可从Web页面中提取所需的知识:对总的用户访问行为、频度、内容的分析,可得到关于群体用户访问行为和方式的普遍知识,用以改进Web服务设计。更重要的是,通过对这些用户特征的理解和分析,有助于开展有针对性的电子商务活动。 Web日志挖掘是从Web日志中挖掘用户访问模式和知识。分析和探索日志中的规律能够确认电子商务中的潜在用户、提高信息服务的质量和提高Web服务系统的性能。Web日志挖掘,尤其是在Web事务聚类方面,有着明显的模糊特征,所以模糊聚类有时比传统聚类方法更适合Web聚类。 论文系统地分析和论述了数据挖掘和Web日志挖掘及相关概念,并通过对Web站点日志数据进行预处理,为下一步模式发掘打好基础; 接着,介绍了聚类分析的方法以及模糊聚类的相关概念和方法: 最后,将基于模糊等价关系的聚类方法应用到Web事务聚类中,分析现有的求模糊相似矩阵的传递闭包方法,针对其效率低运算量大的特点,提出将t-bddge算法应用到将模糊等价矩阵聚类法当中,给出了算法模型以及实例,同时给出了算法的证明并用实验验证分析。

著录项

  • 作者

    柏堃;

  • 作者单位

    大连海事大学;

  • 授予单位 大连海事大学;
  • 学科 计算机应用技术
  • 授予学位 硕士
  • 导师姓名 赵子祥;
  • 年度 2008
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP393.07;
  • 关键词

    Web聚类; 模糊特征; 日志挖掘;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号