首页> 中文学位 >事务间关联规则挖掘技术研究
【6h】

事务间关联规则挖掘技术研究

代理获取

摘要

数据挖掘(Data Mining)是从存放在数据库、数据仓库或其他信息库中的大量的数据中获取有效的、新颖的、潜在有用的、最终可理解模式的非平凡过程。而关联规则挖掘作为数据挖掘中的一项根本性任务,其目标是在事务项目中找出所有的并发关系(Co-occurrence Relationships),这种关系也被称为关联。
   本文对传统的事务间关联规则算法和现有的负关联规则算法进行了系统的分析和总结,在此基础之上提出了新的算法思想,主要包括下面两个方面:
   首先,本文提出了以用户为研究对象,通过对大量用户的行为建立模型,来推测与其具有相似性的用户的可能行为。提出一种新的双策略模型,按照用户对网站的兴趣度将源数据库分割成为两类库,然后对其使用马尔可夫预测模型和事务间关联规则进行兴趣度预测,将复杂的源数据进行修剪,减少了多次重复扫描数据库的工作量,同时也减少了无用规则的产生,能更真实的反映用户的兴趣趋向,在增大算法精确度的基础上也有效的提高了算法的执行效率。
   其次,针对负关联规则挖掘问题,总结现有的挖掘负规则规则的方法,如利用兴趣度、相关性等,并指出其在挖掘负关联规则时仍然存在的不足。提出将相关系数和卡方检验相结合的方法,修正了单单使用兴趣度来度量相关性时产生的歧义,通过计算得出的结果来确定其是正规则、弱规则或者负规则,不仅能通过挖掘规则来使我们得到传统关联规则挖掘中得不到的潜在信息,还能甄别出传统关联规则挖掘中存在的误导规则,提高关联规则的实用性和适用性。
   在现实情况中,事务和事务之间总是存在着因果联系,而关联规则的任务就是找出这些联系。但是随着数据库的增大,数据项的冗余,关联规则结果的增多,数据挖掘的准确效率问题和关联规则结果的可信度问题越加凸显,通过双策略将数据库分而治之,通过负规则检验将误导规则去除,为关联规则挖掘理论研究提供了新的思路。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号