首页> 中文学位 >Web日志会话中识别方法的改进
【6h】

Web日志会话中识别方法的改进

代理获取

目录

文摘

英文文摘

第一章 前 言

第二章 数据挖掘与Web日志挖掘

第三章 Web使用挖掘中的数据预处理技术

第四章 会话识别方法的改进思路

第五章 实验与结果分析

结束语

参考文献

致谢

攻读硕士学位期间发表的论文

展开▼

摘要

随着互联网的发展,Web服务的个性化趋势已成必然。数据挖掘就是从大量的数据中提取隐含的、事先未知的、具有潜在价值的有用信息。随着Web应用的高速发展和广泛普及,在Web服务器上收集了大量的Web日志,这些日志记录了Web用户对Web页面的每一次访问的过程,是一种宝贵的信息资源。挖掘Web日志的关联规则,可以掌握网络流量、理解用户访问模式,进一步可利用这些信息来提高Web系统性能,促进对Web站点的系统设计,以及预测未来用户的数量和爱好,最终可以在日益发展的电子商务领域,指导企业明智地进行市场决策。 Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理,从而解决上面提出的各种问题。会话识别是Web日志挖掘中的重要步骤。针对目前的各种会话识别方法,提出了一种优化的会话切分方法,即一种改进的基于页面内容、下载时间等多个参数综合得到的针对每个用户的个性化识别方法。该方法通过使用访问时间间隔,通过判断是否在极大、极小两个阈值范围内来识别会话。 根据页面内容、站点结构确定的页面重要程度,通过页面的信息容量确定用户正常的阅读时间,通过Web日志中页面下载时间来确定起始阅读时间,对以上因素进行综合后对该阈值进行调整。实验结果表明,相对于目前的对所有用户页面使用单一先验阈值进行会话识别的方法及使用针对用户页面的阈值动态调整方法,本文提出的方法能更准确地个性化确定出页面访问时间阈值,更为合理有效。

著录项

  • 作者

    焦亚丽;

  • 作者单位

    山西财经大学;

  • 授予单位 山西财经大学;
  • 学科 管理科学与工程
  • 授予学位 硕士
  • 导师姓名 马尚才;
  • 年度 2009
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类
  • 关键词

    日志; 会话;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号