首页> 中文学位 >基于Web日志挖掘的自适应网站推荐系统框架研究
【6h】

基于Web日志挖掘的自适应网站推荐系统框架研究

代理获取

目录

文摘

英文文摘

论文说明:插图索引、附表索引

湖南大学学位论文原创性声明及学位论文版权使用授权书

第1章绪论

1.1 Web挖掘研究背景

1.2 Web挖掘研究意义

1.3 Web挖掘研究现状

1.3.1 Web内容挖掘

1.3.2 Web结构挖掘

1.3.3 Web日志挖掘

1.4本文的主要工作

1.5论文的组织

第2章Web日志挖掘概述

2.1数据挖掘技术简介

2.2 Web挖掘研究基本步骤

2.3 Web挖掘分类

2.4 Web日志挖掘流程

2.4.1源数据的收集

2.4.2数据预处理

2.5 Web日志挖掘技术

2.6模式分析

2.7目前在Web日志挖掘领域的研究方向

2.7.1数据预处理方面

2.7.2 Web日志挖掘方面

2.7.3 Web日志分析方面

第3章一种自适应网站推荐系统框架:SAWRS

3.1建设自适应推荐网站的意义

3.2自适应网站推荐系统概述

3.3网站自适应推荐研究现状分析

3.4自适应网站推荐系统框架设计

3.5小结

第4章数据收集和WEB日志数据的预处理

4.1数据来源

4.2 Web日志数据的预处理

4.3 ECLF日志格式分析

4.4预处理过程

4.4.1数据净化

4.4.2用户识别

4.4.3会话识别和路径补充

4.5事物识别

4.6实验结果

4.7小结

第5章浏览模式的挖掘和分析

5.1关联规则

5.2 Apriori算法介绍

5.2.1算法分析

5.2.2算法改进

5.3小结

第6章自适应网站推荐

6.1自适应网站在线推荐

6.2实验结果与讨论

6.3自适应推荐要考虑的几个问题及解决方案

6.3.1推荐项是否已经被该浏览者浏览过的问题

6.3.2网站的更新问题

6.3.3专用Web服务器的实现

6.4小结

结论

参考文献

致谢

跗录A攻读学位期间所发表的学术论文目录

展开▼

摘要

随着WWW应用的高速发展和广泛普及,在WWW服务器上收集了大量的Web日志,因此WEB日志的挖掘结果在很多领域中都变得至关重要,如Web站点的系统设计、商业市场策略和网站个性化等等。自适应网站推荐是数据挖掘在WEB日志数据中的一个应用,其目的是方便用户对网站的访问,它可以预测未来用户的数量和爱好,并为电子商务企业提供决策依据。本文设计了一个自适应网站推荐系统框架SAWRS(Self-AdaptiveWebsitesRecommendationSystem),它分为离线部件和在线部件两部分,其中,前者进行数据收集、预处理、频繁访问模式挖掘;后者根据离线部件现有挖掘规则和用户当前访问行为生成推荐集,实现自适应的在线推荐服务,主要工作有: 分析了基于服务器日志数据的预处理,它是Web挖掘过程中关键的一环,其结果直接影响到挖掘算法处理结果的准确度与可信度,主要包括以下阶段:数据净化、用户识别、会话识别、路径补充和事务识别。本文采用预处理最新研究成果的高效算法实现了日志数据的预处理。 Apriori算法使用逐层搜索的迭代方法,每次迭代均产生大量的侯选K项集,影响了算法的执行效率,本文针对此缺点对算法进行了优化,其核心思想是联接生成K维侯选项集时,判断它的K-1维子集是否存在K-1维频繁项集中,若是则K维侯选项集计数加1,如果不在则直接删除,最终计数等于k的则为k项频繁的,这样每生成一个K维项集只需搜索一遍K-1项集,大大提高了算法的效率。理论分析和实验证明该方法明显优于原算法。 为了使系统能够自动实现自适应推荐服务,本文采用滑窗方法获取当前用户访问路径,然后运用基于聚集树的关联规则算法产生关联规则集,在获得关联规则集后利用推荐集生成算法生成推荐集。理论分析和实验结果表明该方法是有效可行的。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号