首页> 中文学位 >面向数据挖掘的关系型领域知识融合方法研究
【6h】

面向数据挖掘的关系型领域知识融合方法研究

代理获取

目录

声明

致谢

摘要

第一章 绪论

1.1 研究背景及意义

1.2 本文的研究问题及主要内容

1.3 本文的组织结构

第二章 领域知识综述

2.1 领域知识的定义

2.2 领域知识在数据挖掘中的作用

2.3 领域知识的国内外研究现状

2.4 小结

第三章 关系型领域知识模型

3.1 关系型领域知识模型(DKMRM)

3.1.1 单一关系型领域知识的表示模型研究

3.1.2 复杂关系型领域知识模型研究

3.2 基于DKMRM模型的变换讨论

3.3 小结

第四章 面向分类的关系型领域知识融合方法的框架和关键问题

4.1 多关系数据挖掘

4.1.1 多关系的数据挖掘研究现状

4.1.2 存在的问题

4.2 面向分类的领域知识融合方法框架及关键问题

4.2.1 面向分类的领域知识融合方法框架

4.2.2 元组ID传递

4.2.3 传递类标签

4.2.4 搜索关系的路径

4.2.5 领域知识(属性/表)选择

4.2.6 搜索关系的终止条件

4.3 小结

第五章 面向分类的关系型领域知识融合算法

5.1 基于属性选择的CC-DKMR算法

5.2 CC-DKMR实验结果与分析

5.2.1 性质属性分析实验

5.2.2 阈值设定

5.2.3 分类性能比较

5.3 基于表选择的CS-DKMR算法

5.3.1 CS-DKMR算法描述

5.3.2 基于最大信息增益率的多关系表的优化剪枝

5.3.3 基于贡献度的关系表的选择

5.3.4 多关系朴素贝叶斯分类

5.4 CS-DKMR实验结果与分析

5.4.1 数据离散化对比

5.4.2 阈值设定

5.4.3 数据规模对比

5.4.4 分类性能比较

5.5 CC-DKMR与CS-DKMR的算法比较

5.6 小结

第六章 数据挖掘评测阶段的领域知识融合及应用

6.1 数据挖掘评测阶段研究现状与分析

6.2 蜕变测试的基本概念

6.2.1 蜕变测试基本概念和原理

6.2.2 蜕变测试过程

6.2.3 蜕变测试结果的理论分析

6.3 基于蜕变关系的领域知识融合方法

6.3.1 方法描述

6.3.2 领域知识导入—构造蜕变关系

6.3.3 面向数据挖掘的蜕变测试结果初步说明

6.4 实验结果及分析

6.4.1 评测平台Weka

6.4.2 实验数据准备

6.4.3 实验结果及分析

6.4.4 方法普适性初步分析

6.5 小结

第七章 结束语

7.1 主要研究工作

7.2 下一步工作

参考文献

攻读博士学位期间的学术活动及成果情况

展开▼

摘要

现有数据挖掘技术所面向的数据大多是在原始层次上的,相应的挖掘方法是无领域知识融合,或者是依赖于用户参与的人工方式融合领域知识来实现知识发现的过程。然而,实际应用领域的数据存在层次上的差异,有些数据是原始级的,还有些数据与其他一些数据密切相关,并且采用这些相关数据的适当的组合或泛化粒度可能更好地揭示其内在的规律。因此,充分利用与原始数据相关的领域知识指导数据挖掘的工作,能“从极不相同的粒度上观察和分析同一问题”,达到在合理的数据层次上获取知识,在不同的数据层次上灵活转换,做到往返自如,毫无困难,这成为重要的研究课题。
  鉴于实际应用领域中,大量的数据存在着以属性扩展或延伸为代表形式的领域知识,而此类领域知识大多采用关系表的形式出现。因此,本文重点研究关系型领域知识的表示及其与数据挖掘研究工作融合的方法,从而自动有效的开展知识发现工作。
  本文主要研究工作如下:
  (1)提出基于关系模型领域知识的结构化表示模型DKMRM(Domain Knowledge of Multi-Relations Model,DKMRM)。模型中采用关系模型对数据表中的相关属性的领域知识进行映射或投影,从而构成领域知识的上下文关系表,进而形成了复杂的多关系表示模型。在面向关系型数据库系统进行挖掘时,利用这种模型和必要的变换策略,可以将某些原始数据泛化或例化到合理的层次,以获得更符合用户个性化需求的知识形式。
  (2)基于DKMRM的数据挖掘研究工作。提出面向数据挖掘的关系型领域知识融合方法。以分类问题为实际案例,建立融合关系型领域知识的分类挖掘方法框架。针对传统挖掘方法存在的局限性,本方法框架有效解决传递源、传递路径、终止策略、传递的偏差统计等关键问题。
  (3)提出基于属性选择的多关系分类挖掘算法CC-DKMR(Classification of Characters based on Domain Knowledge of Multi-Relations,CC-DKMR)和基于关系表选择的多关系分类挖掘算法CS-DKMR(Classification of Sheets based on Domain Knowledge of Multi-Relations,CS-DKMR),以寻求在不同的数据粒度层次上挖掘模式和灵活的转换机制,从领域知识中获取更有价值的知识。实验表明此方法是有效的。
  (4)提出在数据挖掘的评测阶段融合领域知识的挖掘算法的评测方法,解决数据挖掘的算法(程序)存在的“oracle”现象,传统的评测方法难以具有适应性的问题。基于蜕变测试技术,该方法有效利用领域知识,并针对分类、关联、聚类挖掘算法的具体案例开展研究分析,构造了针对具体算法的蜕变关系。实验结果表明,此方法能有效达到评测目的,并具有适用其它领域的推广可行性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号