Web日志的高效多能挖掘算法

宋擒豹; 沈钧毅

首页> 中文期刊>计算机研究与发展 >Web日志的高效多能挖掘算法

Web日志的高效多能挖掘算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Similar customer groups, relevant Web pages, and frequent accesspaths can be discovered by analyzing of Web log files and customer database. In this paper, novel Web log mining algorithms are presented. First, according to Web site's directed graph defined, a URL-UserID relevant matrix is set up, where URL is taken as row and UserID is taken as column, and each element's value of this matrix is the user's hits. Second, similar customer groups are discovered by measuring similarity between column vectors, and relevant Web pages are obtained by measuring similarity between row vectors; frequent access paths can also be discovered by further processing of the latter. Experiments show the effectiveness of the algorithms.%通过对Web服务器日志文件和客户交易数据进行分析，可以发现相似客户群体、相关Web页面和频繁访问路径.提出了一种新颖的Web日志挖掘算法.在该算法中，首先以Web站点URL为行、以UserID为列建立URL-UserID关联矩阵，元素值为用户的访问次数，然后，对列向量进行相似性分析得到相似客户群体，对行向量进行相似性度量获得相关Web页面，对后者再进一步处理还可以发现频繁访问路径.实验结果表明了算法的有效性.

著录项

来源
《计算机研究与发展》|2001年第3期|328-333|共6页
作者
宋擒豹; 沈钧毅;
展开▼
作者单位

西安交通大学计算机科学与技术系;

西安交通大学计算机科学与技术系;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
客户群体聚类; Web页面聚类; 频繁访问路径; Web日志挖掘; 电子商务;
入库时间 2023-07-25 09:27:43

相似文献

中文文献
外文文献
专利

1. 基于用户访问树的分布式Web日志挖掘算法 [J] . 陈宝国 ,宋旸 . 成都电子机械高等专科学校学报 . 2021,第001期
2. 基于用户访问树的分布式Web日志挖掘算法 [J] . 陈宝国 ,宋旸 . 成都工业学院学报 . 2021,第001期
3. 基于MapReduce的Web日志挖掘算法研究 [J] . 盛昀瑶 ,陈爱民 . 现代计算机（专业版） . 2017,第016期
4. Web日志矩阵挖掘算法研究 [J] . 邵天会 . 中国新通信 . 2016,第022期
5. 基于最长前缀频繁子路径树的Web日志挖掘算法 [J] . 翁伟 ,林开标 ,朱顺痣 . 成都大学学报（自然科学版） . 2013,第003期
6. 基于Web日志的时序关联规则挖掘算法研究 [C] . 张海威 ,袁晓洁 ,窦志成 . 第二十一届中国数据库学术会议 . 2004
7. 基于Web日志的分布式并行数据挖掘算法研究 [A] . 郭沛松 . 2017

Web日志的高效多能挖掘算法

摘要

著录项

相似文献

相关主题

期刊订阅