基于Web日志挖掘和关联规则的个性化推荐系统模型研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着科学技术的飞速发展，互联网提供的丰富信息在助推社会产业部门升级的同时也带来了一些问题，如信息的急速增长易产生大爆炸效应，造成“信息过载”。同时，为了对互联网用户提供更加全面的信息资源，网站经营者和管理者不断向Web站点中添加信息，这就使得Web站点的拓扑结构日益复杂化。由于向Web站点新添加的资源可能不符合用户的真实需求，易造成用户浏览Web站点时出现“资源迷向”。因此，如何从海量的数据中发现人们感兴趣的信息是我们面临的问题。所以，出现了数据挖掘在Web站点分析中的应用，即Web挖掘。
　　Web挖掘是一项综合技术，它涉及Web技术、数据挖掘、信息学、计算机语言学等多个领域。Web挖掘可以在很多方面发挥作用，如对搜索引擎的结构进行挖掘，确定权威页面，Web文档分类，Web使用挖掘，智能查询，建立Metaweb数据仓库等。Web使用挖掘就是从服务器日志中发现用户行为特征和导航模式。本文系统阐述了数据挖掘、Web挖掘以及Web使用挖掘的整个流程，重点研究了Web日志预处理过程、关联规则挖掘模型和滑动窗口推荐模型三方面内容。
　　首先，Web日志预处理过程包括:数据清理、用户识别、会话识别、路径补充和事务识别。经过预处理阶段，可以从用户访问信息中去除大量无关的数据，同时也对Internet上的用户访问信息进行结构化处理，并将其以事务或会话的形式保存在关系数据库中。
　　然后，对预处理后的数据，本文采用加权关联规则对其进行挖掘。
　　经典的关联规则挖掘算法Apriori不仅能够发现Web访问页面之间的相互联系，而且对发现用户偏好导航模式有重要作用。但是，将Apriori算法应用于Web日志挖掘也有其主观局限性。Apriori算法隐含的假设是所有页面的重要性是相同的，它并没有考虑到页面之间的差异性，因此，使用该规则挖掘出来的数据中可能会遗漏掉某些用户感兴趣的页面。
　　针对Apriori算法在Web日志挖掘应用中存在的不足，本文引入“页面权值”这一概念，它反映了用户对页面的真实喜好。根据页面权值的定义，我们综合考虑用户对页面的浏览时间和访问频次两个因素，并在此基础上提出了W-Aprio算法。该算法采用扩展布尔矩阵的表示方式来描述事务数据库，这样有助于事务数据库的压缩。同时，权值的引入也有利于区分页面之间的差异，有效地解决了挖掘过程中遗漏某些重要页面的问题。
　　最后，本文将挖掘得到的规则形成规则库，结合使用滑动窗口技术，设计实践基于关联规则挖掘的Web日志推荐模型。该模型不仅能够有效解决“信息过载”和“资源迷向”等问题。而且可以将用户感兴趣的页面推荐给相关Web用户，实现推荐的个性化。

著录项

作者
李中良;
展开▼
作者单位

西南大学;

展开▼
授予单位西南大学;
学科计算机应用技术
授予学位硕士
导师姓名杨国才;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP393.07;
关键词
日志挖掘; 关联规则; 频繁访问模式; 推荐系统; Web技术;

相似文献

中文文献
外文文献
专利

1. 基于关联规则的Web日志挖掘算法研究 [J] . 张丽伟 ,张晶 . 电脑编程技巧与维护 . 2011,第016期
2. 基于关联规则Web日志挖掘算法的研究 [J] . 孟庆川 ,陈晓明 . 信息技术 . 2010,第003期
3. 基于Web日志挖掘的关联规则算法研究 [J] . 郑玮 . 软件导刊 . 2008,第10期
4. 基于关联规则web日志挖掘方法的研究 [J] . 张友志 ,钱萌 ,程玉胜 . 安庆师范学院学报（自然科学版） . 2006,第001期
5. 基于关联规则挖掘的电子商务个性化推荐系统研究 [J] . 夏敏捷 ,朱国华 . 中原工学院学报 . 2009,第005期
6. 基于改进协同过滤技术的个性化推荐系统模型研究 [C] . Chen Dongtao ,陈东涛 ,Xu Dehua . 第15届海峡两岸信息管理发展与策略学术研讨会（2009） . 2009
7. 基于web日志挖掘的个性化推荐系统模型研究与实现 [A] . 张红钰 . 2005

基于Web日志挖掘和关联规则的个性化推荐系统模型研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅