事务间关联规则挖掘技术研究

代理获取

页面导航

摘要
著录项
相似文献
相关主题

摘要

数据挖掘(Data Mining)是从存放在数据库、数据仓库或其他信息库中的大量的数据中获取有效的、新颖的、潜在有用的、最终可理解模式的非平凡过程。而关联规则挖掘作为数据挖掘中的一项根本性任务，其目标是在事务项目中找出所有的并发关系(Co-occurrence Relationships)，这种关系也被称为关联。
　　本文对传统的事务间关联规则算法和现有的负关联规则算法进行了系统的分析和总结，在此基础之上提出了新的算法思想，主要包括下面两个方面：
　　首先，本文提出了以用户为研究对象，通过对大量用户的行为建立模型，来推测与其具有相似性的用户的可能行为。提出一种新的双策略模型，按照用户对网站的兴趣度将源数据库分割成为两类库，然后对其使用马尔可夫预测模型和事务间关联规则进行兴趣度预测，将复杂的源数据进行修剪，减少了多次重复扫描数据库的工作量，同时也减少了无用规则的产生，能更真实的反映用户的兴趣趋向，在增大算法精确度的基础上也有效的提高了算法的执行效率。
　　其次，针对负关联规则挖掘问题，总结现有的挖掘负规则规则的方法，如利用兴趣度、相关性等，并指出其在挖掘负关联规则时仍然存在的不足。提出将相关系数和卡方检验相结合的方法，修正了单单使用兴趣度来度量相关性时产生的歧义，通过计算得出的结果来确定其是正规则、弱规则或者负规则，不仅能通过挖掘规则来使我们得到传统关联规则挖掘中得不到的潜在信息，还能甄别出传统关联规则挖掘中存在的误导规则，提高关联规则的实用性和适用性。
　　在现实情况中，事务和事务之间总是存在着因果联系，而关联规则的任务就是找出这些联系。但是随着数据库的增大，数据项的冗余，关联规则结果的增多，数据挖掘的准确效率问题和关联规则结果的可信度问题越加凸显，通过双策略将数据库分而治之，通过负规则检验将误导规则去除，为关联规则挖掘理论研究提供了新的思路。

著录项

作者
孙帆;
展开▼
作者单位

辽宁师范大学;

展开▼
授予单位辽宁师范大学;
学科计算机应用技术
授予学位硕士
导师姓名任永功;
年度 2012
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.131;
关键词
数据挖掘; 关联规则; 双策略模型; 卡方检验; 相关系数;

相似文献

中文文献
外文文献
专利

1. 大规模数据集事务间关联规则挖掘方法研究——大数据挖掘方法研究之二 [J] . 张诤 ,王惠文 . 生产力研究 . 2015,第001期
2. 基于事务间关联规则的数据挖掘算法研究 [J] . 李春青 ,李海生 . 福建电脑 . 2014,第012期
3. 一种基于聚类分析的事务间关联规则挖掘算法 [J] . 祁艳艳 ,任永功 . 广西师范大学学报（自然科学版） . 2011,第001期
4. 一种基于最大频繁项目集的挖掘事务间关联规则方法 [J] . 任永功 ,张琰渝 . 计算机科学 . 2008,第011期
5. 关于超市事务数据库挖掘关联规则的设计 [J] . 陈静 . 经济技术协作信息 . 2020,第30期
6. 基于分解事务矩阵的关联规则挖掘算法 [C] . HU Weihua ,胡维华 ,FENG Wei . 2014年全国开放式分布与并行计算学术年会 . 2014
7. Web使用挖掘中事务间关联规则方法研究 [A] . 祁艳艳 . 2011

事务间关联规则挖掘技术研究

摘要

著录项

相似文献

相关主题

期刊订阅