频繁子树挖掘在XML挖掘中的应用

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

近年来，随着互联网的快速发展，网络上的数据越来越庞大，而且数据的类型也越来越繁多，如何有效地利用这些数据，从中提取用户所需要的信息，已经成为现今的一个研究热点。
　　频繁子树挖掘作为数据挖掘中的一个重要研究方向，在XML挖掘、生物信息学、网络日志分析、药物分子设计及其功能预测等中具有十分重要的研究价值，受到了专家学者的广泛关注。XML作为Internet上数据描述和交换的标准，具有结构化、可扩展性、开放性、通用性、灵活性等特点，并且XML和树具有相类似的结构，因此可以将频繁子树挖掘技术应用到XML挖掘中，解决具有复杂层次结构的XML数据挖掘问题。
　　本文研究频繁子树挖掘算法和频繁子树挖掘在XML挖掘中的应用，提出一种频繁子树挖掘算法，以及用树模式来描述XML数据的频繁模式挖掘过程。主要研究工作如下：
　　 (1)介绍频繁子树挖掘技术和XML数据挖掘技术，阐述XML语言的由来、定义、基本结构及特点等。介绍频繁子树挖掘中常见算法及一般处理过程，以及频繁Induced子树与频繁Embedded子树挖掘等概念。
　　 (2)介绍非确定树蕴含集、确定树概率和非确定期望支持度等概念，以及非确定树期望支持度计算方法。提出一种非确定树挖掘算法，利用哈希表快速匹配的特性降低求解期望支持度过程中树同构判定的时间复杂度，利用层次搜索空间来挖掘非确定树，使得非确定树挖掘快速而精确，较为有效地解决了在实际应用中树的非确定性问题。
　　 (3)研究非确定树挖掘在XML中应用，阐述XML频繁模式挖掘与XML文档聚类方法，以及XML文档相似性度量方法。将XML文档表示成非确定树模式，运用非确定树模式挖掘算法对其进行挖掘。

著录项

作者
颜一鸣;
展开▼
作者单位

湖南大学;

展开▼
授予单位湖南大学;
学科计算机应用技术
授予学位硕士
导师姓名李仁发;
年度 2009
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP393.09;TP311.13;
关键词
数据挖掘; 频繁子树挖掘; XML挖掘; 非确定树; 文档聚类;

相似文献

中文文献
外文文献
专利

1. XML数据流分页频繁子树挖掘研究 [J] . 雷向欣 ,杨智应 ,黄少寅 . 计算机研究与发展 . 2012,第009期
2. 一种挖掘XML文档频繁子树的方法 [J] . 傅珊珊 ,吴扬扬 . 计算机工程与科学 . 2007,第010期
3. 极大频繁子树挖掘及其应用 [J] . 杨沛 ,谭琦 . 计算机科学 . 2008,第002期
4. 动态数据库中的频繁子树挖掘算法 [J] . 郭鑫 ,董坚峰 ,周清平 . 计算机科学 . 2011,第005期
5. 快速挖掘最大频繁项集算法在图书馆管理中的应用 [J] . 于海洋 . 计算机与现代化 . 2020,第006期
6. 基于Apriori算法的XML频繁子树挖掘 [C] . 张仕 ,上海交通大学计算机科学系 ,赖会霞 . 第二届全国Web信息系统及其应用会议（WISA2005'） . 2005
7. 频繁子树挖掘及其在XML挖掘中的应用研究 [A] . 朱颖雯 . 2008

频繁子树挖掘在XML挖掘中的应用

目录

摘要

著录项

相似文献

相关主题

期刊订阅