首页> 中文学位 >基于频繁偏爱度的使用模式挖掘系统的分析和设计
【6h】

基于频繁偏爱度的使用模式挖掘系统的分析和设计

代理获取

目录

文摘

英文文摘

学位论文版权使用授权书及独创性声明

第一章绪论

1.1课题的研究背景、目的和意义

1.2本文的主要研究内容

1.3本文的组织结构

第二章相关概念

2.1 Web数据挖掘的产生背景

2.2 Web数据挖掘的分类

2.2.1 Web内容挖掘

2.2.2 Web结构挖掘

2.2.3 Web使用信息挖掘

2.3关联规则介绍

2.3.1关联规则的相关定义

2.3.2关联规则的分类

2.3.3关联规则的一般挖掘步骤

2.3.4由Apriori挖掘算法产生关联规则

2.3.5提高Apriori算法的有效性

2.3.6改善关联规则的挖掘结果

2.4 XML技术

第三章使用信息挖掘系统的分析和设计

3.1使用信息挖掘系统的框架概述

3.2使用信息挖掘系统的数据预处理

3.2.1使用信息挖掘系统的数据来源

3.2.2将使用信息导入到数据库

3.3使用模式的挖掘

3.3.1频繁偏爱度

3.3.2使用模式挖掘

3.3.3使用模式挖掘举例

3.4使用模式的分析

3.4.1知识查询机制

3.4.2 OLAP技术

3.4.3可视化技术

3.5使用模式树

3.5.1使用模式树介绍

3.5.2使用模式树的存储结构

3.5.3使用模式树的构造

3.5.4使用模式树的使用

第四章使用模式的应用

4.1改进Web站点服务

4.2实时推荐用户访问

4.3用户访问入侵检测

4.4相关实验

4.4.1数据预处理

4.4.2使用模式挖掘过程

4.4.3使用模式的使用

第五章总结和展望

5.1论文总结

5.2进一步的工作

参考文献

致谢

攻读硕士学位期间参与科研项目及撰写论文

展开▼

摘要

目前,Internet正以惊人的速度在飞速发展,其应用已经渗透到各行各业,越来越多的公司、机构、个人在Internet上发布和查找消息。Internet上不仅充满了文本、音频和视频等多媒体信息,还包括页面间的链接,用户对页面的访问信息等。人们迫切的希望通过数据挖掘技术来发现隐藏在原始信息中的有用知识,然而由于Internet自身的一些特点,很难直接使用数据挖掘技术来发现有用知识。 人们提出将数据挖掘技术和Internet的特点相结合,即通过Web数据挖掘来发现隐藏在海量信息中的有用知识,从而可以改进Web服务器性能、个性化用户访问和商业智能等。 本文首先介绍了Web数据挖掘产生的一些背景知识、Web数据挖掘的概念及其分类等,重点介绍了Web使用信息挖掘的相关知识,并深入分析了挖掘算法一关联规则挖掘算法,从算法的定义、执行步骤、执行效率到最后算法的分析。 接着,提出一个使用信息挖掘的框架。该框架共分为三个模块,分别是数据预处理模块、使用模式挖掘模块、模式分析和可视化模块。在数据预处理模块中,本文提出一种新型的数据源来代替原有的服务器日志,不仅可以很好的记录用户的使用信息,而且处理步骤简单、快速。在使用模式挖掘模块中,本文针对Internet的特点对关联规则算法提出了一些改进措施,使得挖掘出来的模式真正代表了大多数用户的频繁偏爱使用模式。在模式分析和可视化模块中介绍了目前一些常见的方法,重点介绍了OLAP和可视化技术。 最后,介绍了使用模式的一些应用。使用模式被广泛应用在用户个性化访问、改进服务器性能和商业智能等,然而针对目前Internet的安全问题,本文提出将使用信息挖掘应用在用户访问入侵检测中,通过挖掘出来的入侵模式对用户访问进行入侵检测,改善Internet的安全。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号