一种Web日志挖掘数据预处理方法

摘要

自从WWW问世以来,其信息容量飞速增长.由于Internet是一个开放性、动态性和异构性的全球分布式网络,信息资源分布非常分散,没有统一的管理机构,从而导致了信息获取的困难. 解决这个问题的一个有效途径就是将数据挖掘技术和Web技术结合起来,进行Web上的数据挖掘.Web挖掘可以定义为从与Web相关的资源和行为中抽取感兴趣的有用的模式和隐含信息.Web挖掘可以分为三类:Web内容挖掘(Web contentmining)、Web结构挖掘(Web structure mining)和Web访问模式挖掘(Web usage mining).其中,Web访问模式挖掘中Web日志挖掘是研究的焦点.通过挖掘Web日志记录来发现用户访问Web页面的模式及行为,可以实现用户聚类、页面聚类和发现频繁访问路径,进而改善网站结构设计和为用户提供个性化服务. 随着Internet的发展,网络资源更加丰富,Web日志挖掘已经成为一项重要的研究课题.本文在前人的研究基础上提出了一种基于网站结构的数据预处理方法.采用本文提出的方法进行数据预处理的结果比传统的方法有较大的优越性,更加真实地反映了用户的访问情景,因而能够较好地为Web日志挖掘提供有效数据.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号