基于XML的Web日志挖掘研究和应用

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着因特网技术的迅速发展和不断的普及。Web日志资源越来越丰富，如何充分利用这些资源，从中提取到用户所感兴趣的信息数据，是当前计算机领域的一大挑战。Web日志挖掘就是利用数据挖掘的思想对经过处理的服务器日志进行挖掘。 Web是一个无结构的动态的分布式的信息系统，直接对它进行挖掘是困难的。然而，Web服务器的log日志却有着完整的结构。因此我们提出“基于Web挖掘的个性化服务”，就是利用Web挖掘技术从服务器的日志文件中获取用户的访问模式，并根据这种模式对用户或页面进行聚类，挖掘出具有相似访问兴趣的用户或相似页面。运用聚类的结果可以方便地向浏览模式相似的用户组推荐其感兴趣的主题相似的页面，从而实现个性化服务，同时还可以优化站点的组织结构，进而提高网站的服务质量。本文在研究了数据挖掘的基础上，重点研究了Web日志挖掘的特点、方法和相关的技术。研究分析了将经过预处理的日志数据存储到LOGML数据库的方法，并且将其改进，以便使接下来的模糊聚类更有效率，通过实验结果表明了方法的有效性。然后介绍了模糊聚类理论的应用及研究，通过模糊聚类算法得到相似用户群体和相关Web页面，然后得到频繁访问路径。最后，设计了一个智能网站个性化服务的模型。通过对某网站日志的实践证明，证明了在改进了向LOGML数据库存储日志数据方法的前提下，使得通过模糊聚类算法得到相似用户群体和相关Web页面，然后得到频繁访问路径的准确性，有效性更高。

著录项

作者
罗雪松;
展开▼
作者单位

武汉工程大学;

展开▼
授予单位武汉工程大学;
学科计算机应用技术
授予学位硕士
导师姓名蔡琼;
年度 2008
页码
总页数
原文格式 PDF
正文语种中文
中图分类程序语言、算法语言 ;
关键词
Web日志挖掘; XML; 个性化服务; 模糊聚类; LOGML数据库;

相似文献

中文文献
外文文献
专利

1. 基于XML的Web日志挖掘研究 [J] . 潘有能 . 现代图书情报技术 . 2006 ,第005期
2. 基于SQL Server 2005的Web日志挖掘应用研究 [J] . 罗新 . 现代计算机（专业版） . 2008 ,第012期
3. 基于Web日志挖掘的数据预处理应用研究 [J] . 王娟 ,刘燚 ,赖思渝 . 电脑与信息技术 . 2007 ,第006期
4. 基于模糊聚类的Web日志挖掘的应用研究 [J] . 徐静 ,蔡琼 ,喻俊杰 . 电脑知识与技术 . 2006 ,第007期
5. 基于XML的JavaEE在企业级应用系统的研究与应用 [J] . 张俐 . 现代电子技术 . 2008 ,第024期
6. 关于Oracle XML DB 和DB2 pure XML在基于XML电子病历实现技术方面的比较 [C] . 覃永胜 . 中华医学会第十四次全国医学信息学术会议 . 2008
7. XML及关联规则在Web日志挖掘中的应用研究 [A] . 吴金桥 . 2011

基于XML的Web日志挖掘研究和应用

目录

摘要

著录项

相似文献

相关主题

期刊订阅