首页> 中文学位 >链接结构用于多关系数据挖掘的研究
【6h】

链接结构用于多关系数据挖掘的研究

代理获取

目录

文摘

英文文摘

声明

第一章绪言

1.1数据挖掘概念

1.2多关系数据挖掘

1.2.1多关系数据挖掘概念

1.2.2多关系数据挖掘研究意义

1.2.3多关系数据挖掘研究范畴

1.2.4多关系数据挖掘的应用

1.3研究现状

1.4本文的主要研究内容及组织结构

第二章 链接存在于多关系数据库中

2.1定义与术语

2.2多关系数据库中的链接

2.2.1设计数据库中的概念模型

2.2.2由ER模型向关系模型转换

2.2.3链接的定义

2.3元组ID传播

2.4 小结

第三章 对多关系分类算法FOIL和CrossMine的介绍

3.1定义与术语

3.2单关系上的规则的表示方法

3.3多关系上谓词和规则的表示方法

3.4构造基于规则的多关系分类器的任务

3.5 FOIL算法

3.5.1 FOIL算法描述

3.5.2评估谓词的方法

3.5.3通过连接来搜索和评估谓词

3.6 CrossMine算法

3.6.1把元组ID传播运用到CrossMine

3.6.2 CrossMine算法描述

3.6.3实验

3.7运用构造好的多关系分类器进行预测

3.8小结

第四章贝叶斯分类器用于多关系分类

4.1贝叶斯分类

4.1.1贝叶斯定理

4.1.2朴素贝叶斯分类器

4.2多关系贝叶斯分类算法描述

4.3实验

4.4 小 结

第五章 多关系聚类

5.1聚类的定义以及多关系聚类的定义

5.2一种多关系聚类方法

5.2.1利用多关系信息,计算对象之间的相似度

5.2.2利用凝聚层次聚类的方法,将对象划分成簇

5.3 LinkClus算法

5.4算法之间的比较分析

5.5实验

5.6小结

第六章 多关系关联规则

6.1相关术语的定义

6.2多关系关联规则挖掘算法的基本方法步骤

6.3算法的步骤讲解

6.3.1预处理

6.3.2步骤讲解

6.4两个实例

6.5实验

6.6小结

第七章结论与展望

7.1结论

7.2进一步工作的展望

参考文献

致谢

攻读学位期间发表论文情况

展开▼

摘要

多关系数据挖掘是数据挖掘的一个崭新的研究方向,是数据挖掘最新的研究热点之一。传统的数据挖掘算法是在数据库的一张单一的表上挖掘,当遇到多表时,不得不把多张表集成到一张表中。然而在现实生活中,把多张表集成到一张表需要花费大量的时间,而且还有可能造成信息的丢失,存在效率低、准确率低的问题。因此,多关系数据挖掘的时代已经来临。多关系数据挖掘研究直接在多关系上进行挖掘的算法,不需要进行集成。本文利用元组ID传播的思想,对多关系数据挖掘的各个任务——多关系分类、多关系聚类、多关系关联规则,进行了研究。
   首先,对存在于多关系中的链接进行了定义,并由此引出了元组ID传播的定义。
   其次,利用元组ID传播的思想,结合贝叶斯分类器,提出了一种多关系贝叶斯分类算法。实验表明,在处理多关系时,比起传统的贝叶斯分类算法,该算法具有更高的准确率和效率。
   再次,利用元组ID传播的思想,提出了一种多关系聚类算法。该算法首先利用元组ID传播计算元组之间的相似度,然后按照层次聚类的方法对各个元组聚簇,从实验中可以看出该算法的准确率较高。
   最后,利用元组ID传播的思想,提出了一种多关系关联规则挖掘算法。该算法首先挖掘多关系频繁模式,然后把多关系频繁模式转换成多关系关联规则。该算法可以挖掘出多关系中的各个属性之间存在着的关联规则。实验表明,该算法具有较高的效率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号