首页> 中文学位 >基于电子商务日志的Web使用挖掘研究
【6h】

基于电子商务日志的Web使用挖掘研究

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1课题研究背景及意义

1.2国内外研究现状

1.3研究主要内容和论文结构

1.3.1研究内容

1.3.2论文结构

第二章Web使用挖掘概述

2.1使用挖掘流程

2.1.1数据收集

2.1.2数据预处理

2.1.3模式发现

2.1.4模式分析

2.2使用挖掘在电子商务中的应用

2.3本章小结

第三章序列模式和聚类挖掘相关理论

3.1序列模式挖掘

3.1.1序列模式挖掘由来

3.1.2事务数据库实例

3.1.3相关概念与性质

3.1.4序列模式算法

3.2聚类分析

3.2.1聚类方法分类

3.2.2聚类分析数据结构

3.2.3聚类分析算法

3.3本章小结

第四章Web日志的数据预处理

4.1数据预处理的必要性

4.2数据的来源

4.3数据预处理

4.3.1数据净化

4.3.2用户识别

4.3.3会话识别

4.3.4 Frame过滤

4.3.5路径补充

4.4用户访问事务识别

4.4.1扩展有向树

4.4.2发现最大向前访问路径

4.5本章小结

第五章权值矩阵聚类和GSP序列模式挖掘算法

5.1权值矩阵聚类算法

5.1.1相关定义

5.1.2权值矩阵算法聚类

5.1.3算法分析

5.2 GSP序列模式挖掘算法

5.2.1相关定义与性质

5.2.2 GSP算法发现频繁路径

5.3算法的实例与实验分析

5.3.1实例分析

5.3.2实验分析

5.4本章小结

第六章面向电子商务站点的个性化推荐系统原型

6.1定义与分类

6.2作用与表现形式

6.3系统模块

6.4 PRS原型结构

6.5本章小结

第七章总结与展望

7.1本文工作总结

7.2工作展望

参考文献

致谢

攻读学位期间主要的研究成果

展开▼

摘要

随着Internet的日益普及和电子商务的蓬勃发展,基于电子商务的业务也面临着越来越激烈的竞争。由于电子商务站点可为数据挖掘提供极为丰富的数据源,因而如何运用数据挖掘技术对Web服务器上的日志数据和交易数据进行挖掘,从中抽取感兴趣的模式,以便更好地理解客户的访问行为,或改进站点结构和为客户提供更多的个性化推荐服务,已成为众多商家所关注焦点。因此,开展本研究课题有一定的应用价值和意义。 本文首先概述了Web使用挖掘。介绍了日志挖掘技术中两大关键技术-序列模式挖掘和聚类分析,并分析了算法的优缺点,为后面的应用奠定理论基础。接着,详细讨论了Web日志挖掘的数据预处理过程,包括数据净化,用户识别,会话识别,Frame过滤,路径补充等。 然后,对传统的矩阵聚类算法进行优化,改进为权值矩阵聚类算法。该算法对用户浏览时间和点击次数两个数据的离散化,来得到加权的URL-UserID访问矩阵,应用该算法分别对客户和页面的聚类分析,对客户的聚类来发现相似的客户群体,挖掘潜在客户,对页面聚类来将内容相关的页面归类;接下来,通过对聚类分析后的每一类用户访问日志分析,发现每一类用户的MFP事务数据库,再利用GSP算法找出每一类用户的频繁访问路径。最后把聚类和序列模式挖掘结果应用到电子商务推荐系统中,并给出一个个性化推荐系统PRS的原型。 实验表明改进的权值矩阵聚类算法具有较高准确性和良好扩展性。将挖掘结果应用于个性化推荐系统的思想是有效的、可行的。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号