XML及关联规则在Web日志挖掘中的应用研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

Web挖掘是数据挖掘领域中一个新兴的研究方向，而Web日志挖掘是其中的一个重要的研究内容。Web日志挖掘是通过将数据挖掘技术应用于Web服务器日志文件，以得到Web用户的访问模式。网站设计人员可以据此来改善站点结构，改进站点性能，从而提高站点的服务质量。
　　本文首先介绍了数据挖掘及Web数据挖掘等的基本概念，然后针对Web日志挖掘，重点研究了Web日志数据预处理技术，关联规则算法在Web日志挖掘领域的应用及一种基于多重评价因素的用户相似度计算方法。
　　本文的工作主要有以下几个方面:
　　 1.详细研究和探讨了Web日志数据预处理的整个过程。其中包括:数据清理、站点拓扑识别、页面过滤、用户识别、会话识别、路径补充和事务识别。针对实验数据缺乏引用属性域，提出一种基于站点拓扑结构的路径补充算法;针对日志文件的半结构化特征，提出使用XML存储预处理结果，并给出其详细结构。
　　 2.提出了一种FP-growth改进算法，用于挖掘用户频繁访问序列模式。该算法首先构建FS-tree，然后在其上执行挖掘算法，得到所有的用户频繁访问序列。通过实验同现有的其他挖掘算法进行比对，证明了该改进算法的有效性。
　　 3.针对Web用户模糊聚类，提出一种基于多重评价因素的用户相似度计算方法，该方法综合考虑了页面次数，页面次序及访问时间等因素来计算用户之间的相似程度，并通过实验计算出各个因素所占的比重，实验结果显示使用该用户相似度计算方法的聚类算法具有更好的聚类效果。

著录项

作者
吴金桥;
展开▼
作者单位

东华大学;

展开▼
授予单位东华大学;
学科计算机应用技术
授予学位硕士
导师姓名曹奇英;
年度 2011
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.13;
关键词
数据挖掘; Web日志; 关联规则算法; 拓扑结构;

相似文献

中文文献
外文文献
专利

1. 关联规则在Web日志挖掘中的应用研究 [J] . 王燕 ,徐宏斌 ,杨滋荣 . 计算机时代 . 2008,第012期
2. 关联规则在Web日志挖掘中的研究与应用 [J] . 李纲 ,李春雅 ,胡蓉 . 信息资源管理学报 . 2015,第002期
3. 一种适用于Web日志挖掘的关联规则发现算法 [J] . 栾汝朋 ,张倩 ,张峻峰 . 计算机应用与软件 . 2013,第001期
4. 基于关联规则的Web日志挖掘算法研究 [J] . 张丽伟 ,张晶 . 电脑编程技巧与维护 . 2011,第016期
5. 基于关联规则Web日志挖掘算法的研究 [J] . 孟庆川 ,陈晓明 . 信息技术 . 2010,第003期
6. 大数据技术在Web日志挖掘中的应用研究 [C] . 马超 . 辽宁省通信学会2017年通信网络与信息技术年会 . 2017
7. 基于XML和关联规则的Web日志挖掘研究 [A] . 钟保辉 . 2007

XML及关联规则在Web日志挖掘中的应用研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅