首页> 中文学位 >频繁子树挖掘在XML挖掘中的应用
【6h】

频繁子树挖掘在XML挖掘中的应用

代理获取

目录

文摘

英文文摘

插图索引

第1章 引言

1.1 研究背景及意义

1.2 研究现状

1.3 本文研究内容

1.4 本文的组织结构

第2章 XML数据挖掘技术

2.1 XML概述

2.1.1 XML的基本结构

2.1.2 XML数据交换

2.1.3 XML的应用

2.2 WEB数据挖掘概述

2.2.1 Web数据挖掘的定义

2.2.2 Web数据挖掘的分类

2.2.3 Web数据挖掘的特点

第3章 频繁子树挖掘

3.1 频繁子树概念与理论

3.1.1 树与子树概念

3.1.2 树的类别与表示形式

3.1.3 子树同构

3.2 频繁子树挖掘算法

3.2.1 频繁子树挖掘算法分类

3.2.2 频繁子树挖掘算法的一般过程

3.3 频繁INDUCED子树与频繁EMBEDDED子树挖掘

3.3.1 基于候选生成测试的方法

3.3.2 基于模式,增长的方法

3.3.3 典型算法分析

第4章 非确定树挖掘

4.1 引言

4.2 相关概念及理论

4.3 非确定树模式挖掘算法

4.3.1 非确定树支持度

4.3.2 算法基本思想

4.3.3 算法分析

4.4 实验结果与分析

第5章 树挖掘在XML挖掘中的应用

5.1 XML频繁模式挖掘

5.1.1 XML数据及其以DOM树表示

5.1.2 非确定树挖掘在XML频繁模式挖掘中的应用

5.2 XML文档聚类

5.2.1 XML树相似性度量

5.2.2 XML树的聚类算法

5.3 实验结果与分析

总结与展望

参考文献

致谢

附录

展开▼

摘要

近年来,随着互联网的快速发展,网络上的数据越来越庞大,而且数据的类型也越来越繁多,如何有效地利用这些数据,从中提取用户所需要的信息,已经成为现今的一个研究热点。
   频繁子树挖掘作为数据挖掘中的一个重要研究方向,在XML挖掘、生物信息学、网络日志分析、药物分子设计及其功能预测等中具有十分重要的研究价值,受到了专家学者的广泛关注。XML作为Internet上数据描述和交换的标准,具有结构化、可扩展性、开放性、通用性、灵活性等特点,并且XML和树具有相类似的结构,因此可以将频繁子树挖掘技术应用到XML挖掘中,解决具有复杂层次结构的XML数据挖掘问题。
   本文研究频繁子树挖掘算法和频繁子树挖掘在XML挖掘中的应用,提出一种频繁子树挖掘算法,以及用树模式来描述XML数据的频繁模式挖掘过程。主要研究工作如下:
   (1)介绍频繁子树挖掘技术和XML数据挖掘技术,阐述XML语言的由来、定义、基本结构及特点等。介绍频繁子树挖掘中常见算法及一般处理过程,以及频繁Induced子树与频繁Embedded子树挖掘等概念。
   (2)介绍非确定树蕴含集、确定树概率和非确定期望支持度等概念,以及非确定树期望支持度计算方法。提出一种非确定树挖掘算法,利用哈希表快速匹配的特性降低求解期望支持度过程中树同构判定的时间复杂度,利用层次搜索空间来挖掘非确定树,使得非确定树挖掘快速而精确,较为有效地解决了在实际应用中树的非确定性问题。
   (3)研究非确定树挖掘在XML中应用,阐述XML频繁模式挖掘与XML文档聚类方法,以及XML文档相似性度量方法。将XML文档表示成非确定树模式,运用非确定树模式挖掘算法对其进行挖掘。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号