首页> 中文学位 >基于XML的Web日志挖掘研究和应用
【6h】

基于XML的Web日志挖掘研究和应用

代理获取

目录

文摘

英文文摘

声明

第1章 绪论

1.1 问题的提出

1.1.1 课题的背景

1.1.2 课题的目的和意义

1.2 国内外研究现状

1.3 论文研究的主要内容和结构安排

第2章 Web挖掘

2.1 数据挖掘技术

2.2 Web挖掘技术

2.2.1 Web挖掘的定义

2.2.2 Web挖掘的分类

2.3 Web使用挖掘研究

2.3.1 Web使用挖掘的过程

2.3.2 Web使用挖掘能够获取的知识模式

2.3.3 Web使用挖掘的应用

2.4 小结

第3章Web日志预处理

3.1 Web服务器记录日志的原理

3.2 Web日志挖掘的数据源

3.3 Web日志文件格式

3.4 Web日志挖掘的数据预处理过程

3.5 小结

第4章 基于XML数据存储的Web志挖掘

4.1 Web日志挖掘模型

4.1.1 Web日志挖掘的过程

4.1.2 挖掘过程可视化

4.2 XML的概念与主要特点

4.3 基于XML的日志标记语言LOGML

4.4 LOGML文档的生成

4.5 基于XML的Web日志挖掘体系结构

4.6 数据读入方法的改进以及实验分析

4.6.1 数据读入方法的改进

4.6.2 实验分析

4.7 小结

第5章 Web日志算法的研究与应用

5.1 模糊聚类分析

5.1.1 Web模糊聚类相关概念

5.1.2 模糊聚类分析具体步骤

5.2 模糊聚类算法在Web日志挖掘中的应用

5.2.1 模型的建立

5.2.2 用户聚类算法

5.2.3 页面模糊聚类算法

5.2.4 频繁访问路径发现算法

5.3 小结

第6章 Web个性化服务系统模型

6.1 Web个性化服务模型的设计

6.2 Web个性化服务模型的特点

6.3 Web个性化服务模型的实现

6.3.1 数据预处理模块

6.3.2 数据转换模块

6.3.3 模式挖掘模块

6.3.4 模式分析及应用模块

6.4 小结

第7章 结论

7.1 工作总结

7.2 进一步的研究工作

参考文献

攻读硕士学位期间发表的论文

致 谢

展开▼

摘要

随着因特网技术的迅速发展和不断的普及。Web日志资源越来越丰富,如何充分利用这些资源,从中提取到用户所感兴趣的信息数据,是当前计算机领域的一大挑战。Web日志挖掘就是利用数据挖掘的思想对经过处理的服务器日志进行挖掘。 Web是一个无结构的动态的分布式的信息系统,直接对它进行挖掘是困难的。然而,Web服务器的log日志却有着完整的结构。因此我们提出“基于Web挖掘的个性化服务”,就是利用Web挖掘技术从服务器的日志文件中获取用户的访问模式,并根据这种模式对用户或页面进行聚类,挖掘出具有相似访问兴趣的用户或相似页面。运用聚类的结果可以方便地向浏览模式相似的用户组推荐其感兴趣的主题相似的页面,从而实现个性化服务,同时还可以优化站点的组织结构,进而提高网站的服务质量。 本文在研究了数据挖掘的基础上,重点研究了Web日志挖掘的特点、方法和相关的技术。研究分析了将经过预处理的日志数据存储到LOGML数据库的方法,并且将其改进,以便使接下来的模糊聚类更有效率,通过实验结果表明了方法的有效性。然后介绍了模糊聚类理论的应用及研究,通过模糊聚类算法得到相似用户群体和相关Web页面,然后得到频繁访问路径。 最后,设计了一个智能网站个性化服务的模型。通过对某网站日志的实践证明,证明了在改进了向LOGML数据库存储日志数据方法的前提下,使得通过模糊聚类算法得到相似用户群体和相关Web页面,然后得到频繁访问路径的准确性,有效性更高。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号