基于关联规则与决策树的预测方法研究及其应用

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

1.目前的关联规则挖掘通常采用支持度-置信度-兴趣度模型。在该模型下参数选取都是依靠经验来设定，而且得到的规则数量通常无法估计。如果生成的规则数量太多，则无法有效提取其中有意义的规则。为此，本文分析了该模型下的参数意义，并利用回归方法设计了多种规则条数与参数之间的方程。利用复相关系数检验了方程的拟合效果，并采用显著性检验来验证参数的系数是否显著为零。将复相关系数较大的回归方程作为拟合的最优方程。并利用冠心病数据和University of California Irvine(UCI)数据进行了验证。通过选定的最优方程，可以较好地预测给定参数下的规则的数量，同时优化参数的选择以及确定参数的选择范围。
　　 2.关联规则挖掘已成为现代中医寻找辨证以及用药规律的手段之一。目前，关联规则挖掘采用统一的支持度约束来生成频繁项目集。因此，无法挖掘具有潜在价值和较低支持度的长项目集。为此，本文提出新的关联规则挖掘模型:模糊递减支持度，置信度。在此基础上，通过分析生成的规则前件与后件的相关性，提出了3种修正模型:(1)模糊递减支持度，置信度，兴趣度模型。(2)模糊递减支持度，双向置信度，兴趣度模型。(3)模糊递减支持度，重合度，兴趣度模型。实验:根据医院采集的冠心病数据，提取中医的辨证相关因素和病人的用药数据。实验结果表明，本文提出的模型不仅验证了已有的辨证与用药规律，而且能够挖掘出多因素组合的辨证和多种药物之间的配伍规律。
　　 3.通过对已有的基于变精度粗糙集的决策树分类算法进行分析和研究，发现基于变精度粗糙集构建的决策树算法具有较好的分类效果，且能够容忍噪声数据。但以变精度粗糙集进行属性选择时，仍然具有ID3算法的不足，即往往会选择属性值较多的属性作为分裂结点，而属性值较多的属性往往却不是最优的属性。为此，本文提出了两种新的属性选择方法。第一种属性选择方法，不仅考虑当前结点的属性值个数，而且考虑下层结点的变精度明确区大小，即同时考虑树的两层结点。通过新的属性选择方法，不仅克服了ID3算法中的不足，而且具有变精度粗糙集的优点。第二种属性选择方法，使用了一种综合考虑分类精度和分支数量的属性选择新标准——加权粗糙度和复杂度。同时在结点停止分裂条件中引入了支持度和置信度，提高决策树的泛化能力。为降低噪声数据和缺失值的影响，算法使用了基于匹配度的类别预测方法。通过实验，验证了本文所提出方法的有效性。
　　 4.分析目前处理多值属性和多类标数据的决策树算法，针对其中属性选择困难、孩子结点的相似度计算不够精确等不足，提出了3种新的多值属性和多类标数据的决策树算法。算法中，首先提出了新的孩子结点的类标集相似度计算公式来评定属性分类效果，综合考虑两个多类标集合中元素同时出现或不出现的情况，使类标集相似度的计算更加全面和准确。其次，提出了新的结点停止分裂条件，使得结点的类标集标注更加准确。最后，给出了相应的预测方法。通过实验，验证了算法的分类效果。

著录项

作者
伊卫国;
展开▼
作者单位

大连海事大学;

展开▼
授予单位大连海事大学;
学科计算机应用技术
授予学位博士
导师姓名鲁明羽;
年度 2012
页码
总页数
原文格式 PDF
正文语种中文
中图分类程序语言、算法语言;
关键词
关联规则; 决策树分类算法; 预测方法; 变精度粗糙集; 多类标数据;

相似文献

中文文献
外文文献
专利

1. 基于决策树算法的压裂井判别及效果预测方法研究 [J] . 常凌云 . 中国管理信息化 . 2021,第006期
2. 基于决策树的软件可维护性预测方法研究 [J] . 朱佳俊 ,王炜 ,李彤 . 计算机技术与发展 . 2018,第008期
3. 基于决策树CART算法的钼金属价格预测方法研究 [J] . 邵必林 ,梁元欣 . 世界有色金属 . 2016,第9期
4. 基于CART决策树的复杂生产过程质量预测方法研究 [J] . 戚长松 ,余忠华 ,侯智 . 组合机床与自动化加工技术 . 2010,第003期
5. 基于预测模型决策树的时间序列模型选择方法研究* [J] . 吴菲 ,唐良红 ,冯玉强 . 管理工程学报 . 2001,第001期
6. 基于决策树的医院医疗质量关键指标预测方法研究 [C] . 陈柳剑 ,毕鲁佳 ,张纪林 . 第209场中国工程科技论坛——智慧医疗与医疗资源优化配置 . 2015
7. 基于关联规则的决策树改进算法在贫困生认定中的应用 [A] . 董丽娟 . 2016

基于关联规则与决策树的预测方法研究及其应用

目录

摘要

著录项

相似文献

相关主题

期刊订阅