首页> 中文学位 >基于距离的量化关联规则研究
【6h】

基于距离的量化关联规则研究

代理获取

目录

文摘

英文文摘

声明

1绪论

1.1研究背景

1.2研究现状

1.3研究意义

1.4本文所做工作

1.5论文组织

2数据挖掘概述

2.1数据挖掘定义

2.2数据挖掘对象

2.2数据挖掘基本过程

2.3数据挖掘技术

2.4数据挖掘任务

2.5所面临问题

2.6数据挖掘发展趋势

2.7本章小结

3关联规则挖掘

3.1关联规则挖掘的相关概念

3.2关联规则的度量

3.3关联规则分类

3.4关联规则挖掘模型与步骤

3.5关联规则经典挖掘算法

3.5.1 Apriori算法

3.5.2算法分析

3.6本章小结

4基于距离的量化关联规则

4.1基于距离的量化关联规则的提出

4.2基于距离的量化关联规则的定义

4.3算法分析

4.3.1算法描述

4.3.2分析

4.4算法的改进

4.4.1数据预处理

4.4.2聚类算法的选择与处理

4.4.3基于距离的量化规则的简化

4.4.4簇间关联度的度量

4.4.5关联度参数D0的限定

4.4.6规则的生成

4.5本章小结

5实验

5.1交互界面的实现

5.2实验分析

5.3本章小结

6结论

6.1本文总结

6.2工作展望

参考文献

在学研究成果

致 谢

展开▼

摘要

随着数据库与互联网技术的发展,各个领域的数据及信息量呈指数增长。为解决从大量数据中提取有用的知识以便为决策者提供决策支持的问题,数据挖掘技术随之产生。关联规则分析是数据挖掘技术中的重要方法,用于发现存在于数据库中的项或属性间有趣和有用的联系。目前,对于关联分析中的量化关联规则挖掘已经成为数据挖掘领域重要的研究课题。 本文在关联规则挖掘研究背景下,展开了对基于距离的量化关联规则研究工作。首先,介绍了数据挖掘及关联规则挖掘的一些基础理论、概念和常用算法。在此基础上,研究了关联分析中经典Apriori算法和其在挖掘量化关联规则时存在的问题。然后通过介绍目前挖掘量化关联规则的思想,重点分析了基于距离的量化关联规则(DAR)算法,进而提出了几点改进:第一,改进了聚类部分,用K-means和CADD两种聚类算法对数据进行整体聚类,使聚类结果更能反映数据之间的关系;第二,减少基于距离的量化关联规则定义中的判定条件,从而使挖掘算法更易使用;第三,利用簇半径设置关联度参数D0,使关联度D0对规则的描述更合理、易理解。算法使用VC6.0编程实现,并完成规则挖掘的可视化。最后,为了进一步验证算法的有效性,利用算法对我国某地区地球化学测量数据和临床医学调查数据进行分析,得到的量化关联规则与实际领域知识相一致。

著录项

  • 作者

    申海涛;

  • 作者单位

    内蒙古科技大学;

  • 授予单位 内蒙古科技大学;
  • 学科 控制理论与控制工程
  • 授予学位 硕士
  • 导师姓名 邢东旭,孟海东;
  • 年度 2009
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.13;
  • 关键词

    关联规则; 聚类分析; 关联度; 支持度; 数据挖掘;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号