基于Web访问日志的用户聚类研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着网络技术的飞速发展，囤积在互联网上的数据越来越多。利用Web数据挖掘技术从中提取有用的信息，已成为近期国内外数据挖掘研究方向的热点。其中，Web用户聚类技术利用Web日志记录对用户行为进行分析归类，发现隐藏的用户兴趣和访问规律，从而为互联网企业提供有效的信息，为用户提供更优质的服务。
　　Web用户聚类基于Web日志进行挖掘。该方法首先进行Web日志预处理，选择和抽取用户特征;然后依据提取的特征值衡量用户之间的相似度;最后通过聚类算法得到聚类结果。
　　本文针对基于用户浏览路径的Web用户聚类方法进行分析，深入研究了用户浏览路径聚类算法（UBPC算法）。首先以事务识别提取到的路径作为用户特征，结合雅可比系数与CM系数计算用户相似度，使用路径相似度矩阵表示对象间相似度，给定一个阈值构造相似类，构造相似类后，再删除其中重复的类以及各类间的相交项，最终得到聚类结果。
　　在理论研究的基础上设计开发了基于用户浏览路径的Web用户聚类挖掘系统。该系统包括日志数据的预处理（数据格式转换、数据净化、用户识别、会话识别）、会话相似度计算、用户相似度计算和基于UBPC的Web用户聚类四个主要功能模块。系统选取某所大学的招生办网站日志作为样本开展实验，实验结果表明，系统功能基本达到了设计要求，所用的聚类算法可以得到比较精确的用户聚类效果，不足之处是当挖掘的Web日志数据较多时，系统运行时间较长。

著录项

作者
陈泽红;
展开▼
作者单位

厦门大学;

展开▼
授予单位厦门大学;
学科计算机技术
授予学位硕士
导师姓名张东站;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP393.09;TP311.13;
关键词
数据挖掘; Web日志; 用户聚类; 用户特征; 会话相似度;

相似文献

中文文献
外文文献
专利

1. 基于Web日志的匿名网络用户聚类研究 [J] . 宋斌 ,王玲 ,张宏 . 南京理工大学学报（自然科学版） . 2006 ,第005期
2. 基于Web日志用户访问路径的Apriori算法的研究 [J] . 邵天会 . 电子技术与软件工程 . 2015 ,第022期
3. 基于Web日志的用户访问推荐系统的研究与实现 [J] . 魏榴花 . 电脑知识与技术 . 2010 ,第030期
4. 基于Web日志的频繁访问页面挖掘研究 [J] . 王涛伟 . 计算机系统应用 . 2006 ,第010期
5. 基于Web日志的用户访问路径提取与分析 [J] . 刘颖 ,彭赓 ,吕本富 . 情报学报 . 2009 ,第004期
6. 基于Web日志挖掘的用户聚类研究 [C] . 冯征 . 第七届中国Rough集与软计算、第一届中国Web智能、第一届中国粒计算联合会议（CRSSC-CWI-CGrC'2007） . 2007
7. 基于Web日志挖掘的用户聚类研究 [A] . 牛晓晨 . 2011

基于Web访问日志的用户聚类研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅