首页> 中文学位 >Web日志中浏览模式挖掘算法的研究
【6h】

Web日志中浏览模式挖掘算法的研究

代理获取

目录

文摘

英文文摘

声明

第1章绪论

1.1课题研究的背景、目的和意义

1.2 Web日志挖掘研究现状

1.3 Web日志挖掘研究难点

1.4论文的主要内容和组织结构

第2章Web数据挖掘

2.1 Web挖掘概述

2.1.1 Web挖掘的特点

2.1.2 Web挖掘的分类

2.1.3 Web数据挖掘的困难

2.2 Web日志挖掘

2.2.1 Web日志

2.2.2基本概念

2.2.3 Web日志挖掘过程

2.2.4 Web日志挖掘的应用

2.3本章小结

第3章Web日志中用户浏览模式挖掘

3.1用户频繁访问模式挖掘过程

3.2相关概念和定义

3.3浏览模式挖掘方法

3.4类Apriori算法

3.4.1经典频繁项集挖掘算法Apriori简介

3.4.2基于Web日志的类Apriori算法

3.5现有研究的分析

3.6本章小结

第4章用户浏览模式挖掘算法的研究

4.1基于时态约束的频繁访问模式的挖掘算法

4.1.1相关定义

4.1.2算法的基本思想

4.1.3算法描述

4.1.4生成网页关联规则的方法

4.2增量日志挖掘技术研究

4.2.1关联规则增量更新算法概述

4.2.2 WLIU增量更新算法

4.3算法分析及实验结果

4.4本章小结

第5章Web日志挖掘原型系统

5.1日志挖掘原型系统的实现

5.1.1实验环境及开发平台

5.1.2系统概述

5.1.3用户会话功能模块

5.1.4用户事务识别功能模块

5.1.5频繁访问模式功能模块

5.1.6网页关联规则挖掘功能模块

5.2本章小结

结论

参考文献

攻读硕士学位期间发表的论文和取得的科研成果

致谢

个人简历

展开▼

摘要

Internet技术的发展和普及使信息获取和发布的方式发生了巨大的飞跃和本质性的变化。目前,以电子商务、电子图书馆、远程教育等为Web的主要应用,促使Web以更快的速度发展,在给人们带来丰富信息和极大便利的同时,对Web站点的设计和功能提出了更高的要求。要求Web具有智能性,能快速、准确地找到用户所需要的信息;能为不同用户提供不同的服务;能允许用户根据自己的需要定制页面;能为用户提供产品营销策略信息等等。解决这些问题的途径之一就是将传统数据挖掘技术应用于Web日志,即利用数据挖掘的原则和思想,针对Web日志的新特性,对传统挖掘方法进行扩展和改进,将其应用到Web日志上,挖掘出有用的模式,根据用户的浏览模式,可以改进站点的设计和服务,开展个性化服务和构建智能化网站。目前,Web日志挖掘已经成为国际上一个新兴的重要研究领域,其研究工作具有非常重要的现实意义。 本文系统地阐述了Web数据挖掘到Web日志数据挖掘的整个过程,重点对Web日志中浏览模式挖掘算法进行了研究。在浏览模式挖掘中,采用传统的关联规则挖掘算法要频繁扫描数据库,产生大量候选集,效率低;另外,现有的算法很少考虑到浏览模式的时效性,为了解决这个问题本文提出了一个适用于Web日志的带有时态约束的浏览模式挖掘算法。该算法简化了挖掘过程中候选模式的生成操作,只对数据库扫描一次,求出所有连续子序列集,利用集合运算求得支持度,同时逐步修正会话时间得到浏览模式的有效时间,与类Apriori算法相比运行时间少,扩展性好,并且挖掘出的模式具有时效性。在此基础上,对现有的增量更新挖掘算法进行改进,增加了时态因素,能很好地适应Web日志的不断变化。最后,设计并实现了一个Web日志挖掘原型系统,证明了此算法的快速性和有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号