首页> 中文学位 >基于Frame页面过滤与关联规则的Web日志挖掘的研究
【6h】

基于Frame页面过滤与关联规则的Web日志挖掘的研究

代理获取

目录

文摘

英文文摘

声明

1绪论

1.1背景

1.2本文主题

1.3本文的内容和结构

2 Web日志挖掘

2.1数据挖掘

2.2 Web日志挖掘

2.3日志文件

2.4公共概念

2.5本章小结

3日志预处理技术的改进

3.1 Web日志挖掘中的预处理技术

3.2解决方法和算法

3.3实验结果

3.4本章小结

4挖掘频繁访问页组的加强算法

4.1关联规则

4.2 Web日志中频繁访问页组挖掘的加强算法

4.3实验结果

4.4本章小结

5总结与展望

参考文献

致谢

展开▼

摘要

如何让Internet更好地为人类服务,是未来几年的一个真正挑战.一方面是人们对快速、准确而全面获取信息的渴望,而另一方面却是Internet上信息的纷繁芜杂,在这两者之间架设一座桥梁的确是一个巨大的挑战.作为从浩瀚的Web信息资源中发现潜在的有价值知识的一种有效技术.Web挖掘正悄然兴起,倍受关注.目前Web挖掘的研究正处于发展阶段,尚无统一的结论,需要国内外学者在理论上开展更多的讨论.Web日志数据是记录用户对Web站点访问信息的数据,保存有大量的路径信息,对这些信息的分析有利于设计人员掌握用户的喜好和访问习惯,并可以用来对网站的结构进行优化和页面重组.所以产生了Web日志挖掘.本文首先介绍了Web日志挖掘的有关背景和相关概念.然后研究了Web日志挖掘中的相关技术,在以下几方面进行了改进:(1)在Web日志预处理技术的研究中提出了一种改善预处理结果的方法——Frame页面过滤技术;(2)关联规则挖掘是数据挖掘研究中的一个热点,在本文的研究中综合了一个高兴趣度的频繁访问页组所需满足的一些基本条件,然后针对这些条件,提出了一个基于传统关联规则的提高挖掘结果的兴趣度的频繁访问页组加强算法.最后用实验证明改进过的过滤技术与挖掘算法比传统数据挖掘技术更适合应用于Web日志方面的挖掘.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号