摘要:本文提出基于粗糙集的Apriori改进算法.分为两个部分:第一部分,根据粗糙集理论求出属性项集的依赖度,继而得到属性项集在一条记录中同时出现的概率;第二部分,首先扫描数据库,得到每个1项集的概率,利用第一部分求出的属性项集的依赖度估算出2,3,…,k项集的概率,从而根据2,3,…,k项集的概率经过最小概率剪枝得到候选频繁2,3,…,k项集;又扫描数据库,得到所有候选频繁项集的支持度;最后用最小支持度和最小可信度得到最后的频繁项集,进而得到关联规则.此法能够避免重复扫描数据库,避免产生大量的候选集,大大地减少搜索空间和缩短搜索时间.