首页> 中文学位 >关联规则挖掘方法及其在冠心病中医诊疗中的应用研究
【6h】

关联规则挖掘方法及其在冠心病中医诊疗中的应用研究

代理获取

摘要

冠心病是严重危害人类健康的常见病和多发病,已成为导致人类死亡的重大疾病之一。研究如何快速有效地从海量冠心病中医临床诊疗数据中挖掘蕴含其中的关联规则,并将得到的关联规则合理应用到冠心病的中医临床诊疗中,具有十分重要的理论和实际意义。
   根据冠心病中医诊疗数据的特点和挖掘需求,本文将向量法引入关联规则挖掘中,从脉象、舌质、发病诱因等18个方面与26种冠心病中医证型之间挖掘出中医辨证规律,得到了一系列的冠心病辨证规则,为冠心病的确诊与预防提供了重要的决策依据。
   冠心病诊疗数据往往是多值属性、多类标数据,传统的关联规则挖掘算法通常没有较好地结合领域知识,直接挖掘其中存在的规则,效率较低。为此,本文结合冠心病中医诊疗数据的特点,对决策属性和非决策属性进行分块编码,提出一种前后件约束的关联规则挖掘算法,可有效挖掘出中医治疗冠心病的用药规律,大大提高了算法的运行效率。此算法对于寻找决策属性与非决策属性之间的关联规则的数据挖掘问题具有一定的理论和实际价值。
   传统关联规则通常采用统一支持度阈值挖掘频繁项目集,导致支持度较低的长项目集无法被挖掘。若降低支持度阈值将产生大量冗余短项目集,同时会导致算法效率大大降低。为此,本文提出了一种前后件和长度递减支持度约束的关联规则挖掘方法,能够有效地挖掘更多的长模式,减少无用的短模式,使得生成的规则更具有理论和实际价值,能够有效辅助冠心病诊断和治疗。
   目前许多学者对生成规则前件与后件相关性进行了大量研究并提出若干相关性度量方式,但所提出度量方式绝大多数是以事物发展过程中的相关性不变为前提的。然而这种全局相关性的研究具有很大的偶然性,如果项集之间的相关性发生变化的话,就会出现当前挖掘出的关联规则的支持度和置信度较高,并且是正相关的,但随着时间的推移或某些特殊事件的发生将会出现当前规则的支持度和置信度变化,甚至出现不相关。针对关联规则在全局相关性方面的不足,本文提出了一种分段式非线性回归和反向验证的方法,并对关联规则的相关性进行验证。该方法对关联规则相关性的分析更加准确,产生规则的数量大大减少,能够挖掘出更有意义的关联规则。通过在冠心病中医诊疗数据上的实验,表明此方法更具有实际意义。
   关联规则的挖掘算法大多是基于支持度.置信度框架理论的,如果考虑到数据的时间因素以及规则前件与后件的相关性问题,这种方式并不是很有效。本文提出了一种新的关联规则框架:时效支持度.时效匹配度。采用新的匹配度方法取代传统的置信度,可以有效解决规则前件与后件的相关性问题,以支持度-匹配度框架为基础加入时间熵因子,使得生成的规则能够体现数据的时效意义。通过实例说明了该框架的可行性及优越性,并提出了新增数据库时的关联规则维护算法及实现思想,通过实验证明了该算法的有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号