基于数据仓库的关联规则抽样算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

数据挖掘是从存放数据库、数据仓库或其它信息库中的大量数据中挖掘有趣知识的过程。它包含关联规则挖掘、预测、分类、聚类、演化分析等多种技术手段，其中关联规则挖掘是一种主要的也是用途最广的数据挖掘方法。关联规则概念最早是由在IBM工作的RakeshAgrawal博士于1993年提出的，用于刻画事务数据库中交易项目之间的关系，即频繁关系。本文对关联规则挖掘的经典算法：Apriori，AprioriTid，AprioriHybrid以及FUP2算法进行了研究。抽样对于数据挖掘技术来说实用性很强，因为类似技术在大多数事件中已经极大的满足了使用者的要求，作者想通过使用改进抽样技术来维护关联规则，目前，已经针对数据库改变时维护关联规则做了一些研究。所有这些方法不仅要对原始数据库中改变的部分扫描，同时也要扫描对未改变的部分，工作量很大，要花费很多时间。而且，如果在数据库上更新的规则执行的很频繁但原有规则调整改变不大时，就会浪费大量的精力。在本文中，作者将改进一种抽样技术的算法来估算数据库更新前后关联规则的差别，这种差别可以用来决定是否更新挖掘关联规则，如果估算的差别很小，那么在原始数据库中的规则对于更新过的数据库就是一个很好的近似。因而，作者就不必花费精力去更新规则，在真正更新规则之前作者可以累计部分更新，从而避免了过度频繁的更新规则，实验结果证明此算法是有效的和高度精确的。

著录项

作者
丁虎;
展开▼
作者单位

哈尔滨工程大学;

展开▼
授予单位哈尔滨工程大学;
学科计算机应用技术
授予学位硕士
导师姓名张健沛;
年度 2006
页码
总页数
原文格式 PDF
正文语种中文
中图分类抽样理论、频率分布;算法理论;
关键词
数据挖掘; 关联规则; 抽样算法; 置信区间; 数据仓库; 数据库;

相似文献

中文文献
外文文献
专利

1. 基于抽样的分布式约束性关联规则挖掘算法研究 [J] . 李宏 ,陈松乔 ,杜剑峰 . 计算机科学 . 2006,第007期
2. 基于关联规则的高校人力资源数据仓库构建与信息挖掘 [J] . 谭国强 ,肖力 . 江西通信科技 . 2011,第004期
3. 基于数据仓库的多维关联规则挖掘在电信系统中的应用 [J] . 唐培丽 ,解飞 ,胡明 . 情报科学 . 2007,第10期
4. 基于关联规则数据挖掘技术在数据仓库中的应用 [J] . 马骊 . 计算机工程 . 2005,第0z1期
5. 基于关联规则数据挖掘技术在数据仓库中的应用 [J] . 马骊 . 计算机工程 . 2005,第B07期
6. 挖掘关联规则的新抽样算法 [C] . 张兆功 ,李建中 . 第十六届全国数据库学术会议 . 1999
7. 基于极值抽样的关联规则新算法研究 [A] . 黄志炜 . 2006

基于数据仓库的关联规则抽样算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅