基于XML的WEB日志挖掘研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

WEB日志挖掘的主要目标是从WEB的访问记录中抽取感兴趣的模式，通过分析这些挖掘结果可以帮助理解用户的行为，从而改进站点的结构或为用户提供个性化的服务。
　　在WEB数据挖掘领域中WEB日志挖掘技术对于网站的结构优化和页面内容的重新组合都起到了重要作用。目前检索WEB的信息主要采用搜索引擎来完成，但是大多数搜索引擎都缺少主动性，没有考虑访问用户的兴趣偏好和访问者的不同，无法有效地解决信息迷失和信息过载的问题。而解决这个问题的途径之一就是将数据挖掘技术应用于WEB服务器日志的挖掘，通过日志挖掘，从用户在WEB网站上浏览行为的数据中获取用户的浏览模式。根据用户的行为模式，改进网站的设计和服务，开展个性化服务和构建智能WEB站点。
　　本论文详述了在研究个性化信息推荐服务中必须要着重解决的以下几个方面的问题：WEB日志的预处理、WEB日志挖掘算法、个性化推荐方法。详细讨论了WEB日志挖掘预处理的各个步骤，并且给出了每一步的关键算法。WEB日志挖掘预处理过程主要包括：数据清理、用户识别、会话识别、路径补充和用户事务模式识别。
　　本文分别以关联规则和聚类两种方式完成对用户的个性化服务，即为用户提供推荐页面集。本论文提出一种改进的关联规则Apriori算法，该算法为关联规则APriori算法的改进，通过引入分辨矩阵实现只需扫描一次数据库，避免不必要的多次扫描，从而提高Apriori算法的效率，减少了扫描事务数据库的次数，并提高项集的支持计数速度。
　　最后，本文初步设计了一个具有独创性的日志预处理系统，以产生日志挖掘所需的数据。本文初步建立了一个用户访问模式挖掘系统，系统的建立有助于查询、分析访问者的操作、了解用户的访问信息。通过监测用户的访问行为，根据对用户的访问情况进行日志挖掘，并以图例方式描述挖掘后的数据，了解用户的喜好加以改进，以提供个性化服务。

著录项

作者
方杰;
展开▼
作者单位

合肥工业大学;

展开▼
授予单位合肥工业大学;
学科计算机应用技术
授予学位硕士
导师姓名王浩;
年度 2009
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP393.092;
关键词
数据挖掘; WEB服务器; 访问日志; Apriori算法; 用户行为模式;

相似文献

中文文献
外文文献
专利

1. 基于XML的Web日志挖掘研究 [J] . 潘有能 . 现代图书情报技术 . 2006,第005期
2. 基于Web日志挖掘的个性化推荐网络教学模型研究 [J] . 梁燕红 . 农业网络信息 . 2017,第008期
3. 基于MapReduce的Web日志挖掘算法研究 [J] . 盛昀瑶 ,陈爱民 . 现代计算机（专业版） . 2017,第016期
4. 基于Web日志挖掘的个性化推荐模型的研究 [J] . 窦保媛 ,苏依拉 ,杨双涛 . 内蒙古工业大学学报（自然科学版） . 2016,第003期
5. 基于Web日志挖掘的网络学习行为建模研究 [J] . 马伟杰 . 河南教育学院学报（自然科学版） . 2016,第004期
6. 关于Oracle XML DB 和DB2 pure XML在基于XML电子病历实现技术方面的比较 [C] . 覃永胜 . 中华医学会第十四次全国医学信息学术会议 . 2008
7. 基于XML的Web日志挖掘研究和应用 [A] . 罗雪松 . 2008

基于XML的WEB日志挖掘研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅