基于Web用途数据预处理的聚类挖掘研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

超级链接,作为一种连接万维网上分散信息的媒介,正以惊人的速度被大量使用.它在为我们提供丰富资讯的同时,也对如何详细的分析上网用户的行为以及网上资源的特点提出了挑战.随着网站的容量和复杂度的增加,只是对服务器日志简单地统计是远远不够的;通过采用各种数据挖掘的手段对用户的访问记录(日志)进行处理加工从而发现隐含的有价值信息(知识)正是网络用途挖掘(Web Usage Mining)的目标所在.该文在概述了数据挖掘和数据仓库等有关知识的基础上,介绍了Web挖掘的基本概念,分类和发展现状.在分析了数据预处理工作的意义后,详细分析了面对海量的用途数据,如何去粗取精,去伪存真,如何将原始的日志文件归整加工成不同挖掘粒度,即用途数据预处理的整个过程;提出了完全拟合W3C提供的若干用途数据结构的预处理模型,并通过实验验证了算法的合理性.继而,又从数据预处理的角度,分析了聚类--这种数据挖掘功能的意义;介绍了各种适用于聚类操作的研究方法;针对由预处理阶段得到的点击流,采用寻找最长共同子序列(LCS)的方法定义了点击流之间的相似度,并由此生成了加权无向图;最后简述了如何利用图形分割技术实现点击流聚类的方法.最后总结全文的内容,并对下一步的工作做出合理预见.

著录项

作者
张琦琪;
展开▼
作者单位

太原理工大学;

展开▼
授予单位太原理工大学;
学科计算机应用
授予学位硕士
导师姓名陈俊杰;
年度 2004
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.13;
关键词
Web用途挖掘; 聚类; 会话; 页面视图; 点击流; 最长共同子序列;

相似文献

中文文献
外文文献
专利

1. 一种改进的基于Web使用挖掘的数据预处理方法的研究 [J] . . 安徽电子信息职业技术学院学报 . 2014,第002期
2. 基于Web日志挖掘的数据预处理应用研究 [J] . 王娟 ,刘燚 ,赖思渝 . 电脑与信息技术 . 2007,第006期
3. 基于Web日志挖掘技术的服务器数据预处理研究 [J] . 陈秀菊 . 重庆科技学院学报（自然科学版） . 2007,第003期
4. 基于Web日志挖掘数据预处理技术的研究 [J] . 陈荣旺 ,郭红 . 福建电脑 . 2007,第006期
5. 基于web日志挖掘的数据预处理研究 [J] . 曹明 ,闪四清 . 科技资讯 . 2007,第004期
6. 基于Web文本挖掘的聚类技术研究 [C] . 李凯 ,孙大鹏 ,穆筝 . 辽宁省通信学会2011年通信网络与信息技术年会 . 2011
7. 基于Web服务器日志挖掘的数据预处理技术研究 [A] . 李志 . 2011

基于Web用途数据预处理的聚类挖掘研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅