您现在的位置: 首页> 研究主题> 决策树

决策树

决策树的相关文献在1980年到2023年内共计6962篇,主要集中在自动化技术、计算机技术、经济计划与管理、无线电电子学、电信技术 等领域,其中期刊论文5551篇、会议论文269篇、专利文献28077篇;相关期刊1858种,包括电脑知识与技术、福建电脑、计算机工程等; 相关会议240种,包括2016电力行业信息化年会、中国水利学会2010年空间信息技术在水利领域应用研讨会、2010国际信息技术与应用论坛等;决策树的相关文献由15382位作者贡献,包括刘海涛、金平艳、胡成华等。

决策树—发文量

期刊论文>

论文:5551 占比:16.38%

会议论文>

论文:269 占比:0.79%

专利文献>

论文:28077 占比:82.83%

总计:33897篇

决策树—发文趋势图

决策树

-研究学者

  • 刘海涛
  • 金平艳
  • 胡成华
  • 王伟
  • 王鹏
  • 王磊
  • 王勇
  • 王熙照
  • 李伟
  • 王力
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

作者

    • 官松美; 叶志荣; 邓莉; 杨全; 李柳珠; 兰媛媛; 路晓钦
    • 摘要: 目的探究注射用七叶皂苷钠不良反应(ADR)的流行病学特点及ADR发生的相关因素。方法选取重庆市2014—2019年注射用七叶皂苷钠ADR报告为调查对象,对合格上报的1391例ADR进行流行病学统计,对符合纳入条件的1338例ADR报告采用决策树、关联规则法进行ADR特点分析。结果七叶皂苷钠ADR累及系统与患者性别、年龄、给药途径、用药原因等因素相关。ADR发生时间主要集中在用药后10~30 min和1~3 d这2个时间段。结论七叶皂苷钠ADR临床较为常见,应充分了解该药ADR发生原因和特点以保证临床用药安全有效。
    • 朱先鸿; 王星捷; 袁伟强
    • 摘要: 青藏高原分布着全球海拔高、数量多、面积大的高原湖泊群,这些湖泊的变化能够真实地反映出区域的气候与环境状况。科学地分析湖泊演变规律将为区域环境与气候的研究提供关键的数据支撑。在以往的相关研究中,基于湖泊水域面积的分析方法大多利用ENVI等相关软件进行处理,处理过程较繁琐,需要耗费大量的时间。文中基于以上问题,设计与实现了青藏高原的湖泊水域面积提取系统,该系统充分利用地理信息及遥感技术,结合经典机器学习算法支持向量机(SVM)、决策树对湖泊水域进行智能提取,实现对青藏高原湖泊群水域面积的统计,揭示出其演变规律。通过实验分析得出,在2016年到2020年,青藏高原湖泊的面积呈增长趋势,与前人的研究保持一致,为湖泊水域面积的提取提供了技术参考和实现方法。
    • 宋明; 刘芸宏; 吴晓慧; 李倩; 王书会
    • 摘要: 目的 基于决策树卡方自动交互检测(CHAID)算法和神经网络分析脑卒中手术患者医院感染危险因素,为早期筛查医院感染高危人群提供科学依据。方法 前瞻性收集2016年1月-2019年12月某三级甲等医院进行脑卒中手术患者的临床资料,应用CHAID算法和神经网络分析脑卒中患者医院感染的危险因素,并与多元logistic回归分析进行比较。用受试者工作特征曲线(ROC)下面积(AUC)比较不同模型的预测效果。结果 共纳入脑卒中手术患者1124例,医院感染269例,医院感染发生率为23.93%;决策树和神经网络分析均显示留置胃管、住院时间和静脉血栓是脑卒中手术患者医院感染的危险因素,决策树模型预测的正确率为81.1%,ROC曲线下面积为0.821(95%CI:0.799~0.848);神经网络模型预测的正确率为86.2%,ROC曲线下面积为0.874(95%CI:0.852~0.894);通过比较,两模型预测效果好,存在的差异有统计学意义(Z=5.565,P<0.001)。结论 神经网络分析模型预测效果优于决策树模型,两模型分别从不同层面探究脑卒中患者医院感染的危险因素,便于早期筛查医院感染的高危患者,开展有效的预防控制措施,降低医院感染的发生率。
    • 邢强; 张晋言; 王镇方; 马睿; 姜文宗; 刘宝弟; 王延江
    • 摘要: 传统的测井解释规则库的获取需专业研究人员以手工方式进行,存在繁琐、耗时等缺点,且技术熟练程度直接影响到解释评价效果,为此,提出了一种基于XGBoost的测井解释规则库自动获取或建立测井解释专家规则库的方法,将多种物理信息和地质参数作为输入特征,储层类别作为输出标签,通过引入XGBoost算法,经过学习得出地质参数与储层类别之间的关系模型。利用该模型,可以自动预测储层类别,进而建立测井解释规则库。胜利油田盐家永安地区某砂砾岩油气藏的砂砾岩测井解释评价结果表明,与支持向量机(SVM)算法和梯度提升决策树(GBDT)算法相比,本文方法具有更高的准确率和更高的计算效率。研究区老井复查结果表明:与手工获取规则库方法相比,本文方法较完整地提取了研究区内的知识规则,提升了测井解释的准确率。
    • 史鹏; 孙金月
    • 摘要: 目的:NCP肺炎疫情致使我国部分居民出现替代性创伤(VT),期望从身体活动增进心理健康的角度出发,为减轻心理应激提供建议。方法:采用IPAQ长卷和IES-R量表对我国5个省份15个城市居民身体活动水平和VT进行调查,通过χ^(2)检验调查影响我国居民VT的影响因素,通过决策树模型对居民VT进行识别。结果:不同身体活动水平(χ^(2)=6.575,P=0.037)、居住地病例(χ^(2)=3.945,P=0.047)、最高学历(χ^(2)=28.586,P=0.000)居民出现替代性创伤的比例具有显著性差异,且高体力活动水平、居住地病例在30例以下、专科及以下学历人群出现替代性创伤的可能性更低;决策树模型(深度4,节点13,终端节点7,准确率79.9%)认为本科及研究生学历且居住地病例在31例以上居民高身体活动水平出现替代性创伤的可能性较低,而高身体活动水平且25岁以下特征居民也有出现替代性创伤的可能性。结论:高身体活动水平居民出现VT的可能性较低,但其与年龄、居住地病例和最高学历存在交互作用,建议相关特征居民减少疫情信息输入,转移注意力,适当提高身体活动水平,改善负面情绪,减轻应激反应。
    • 刘胜娃; 曹湘华
    • 摘要: 有效地提高钻井工作的安全性与生产稳定性,是当前钻井工作发展过程中面临的一个重要问题。本文针对钻井工况识别问题,基于钻井过程中多项监测数据,提出了一种基于决策树的钻井工况智能识别方法,并采用朴素贝叶斯算法、支持向量机以及钻井现场的实际钻井数据对该方法的有效性和准确性进行对比、验证,发现基于决策树的工况识别正确率最优且达到了97%。实验结果表明该方法能够实现钻井工况的智能识别,在一定程度上满足油田数字化与智能化的需求。
    • 常硕; 张彦春
    • 摘要: 随机森林在bootstrap的基础上通过对特征进行抽样构建决策树,以牺牲决策树准确性的方式来降低决策树间的相关性,从而提高预测的准确性。但在数据规模较大时,决策树间的相关性仍然较高,导致随机森林的性能表现不佳。为解决该问题,提出一种基于袋外预测的改进算法,通过提高决策树的准确性来提升随机森林的预测性能。将随机森林的袋外预测与原特征相结合并重新训练随机森林,以有效降低决策树的VC-dimension、经验风险、泛化风险并提高其准确性,最终提升随机森林的预测性能。然而,决策树准确性的提高会使决策树间的预测趋于相近,提升了决策树间的相关性从而影响随机森林最终的预测表现,为此,通过扩展空间算法为不同决策树生成不同的特征,从而降低决策树间的相关性而不显著降低决策树的准确性。实验结果表明,该算法在32个数据集上的平均准确率相对原始随机森林提高1.7%,在校正的paired t-test上,该方法在其中19个数据集上的预测性能显著优于原始随机森林。
    • 王佳齐; 杨思宇
    • 摘要: 针对大学生心理健康问题相关数据的采集与分析需求,文中提出了一种基于大数据匹配的心理健康因素分析算法。通过数据的采集与预处理,实现社交模型、情感模型和兴趣模型的融合。文中分析计算了信息数据集合信息熵与信息增益率,利用剪枝决策树算法,可在最大程度分析处理相关数据的同时,使用后向剪枝理论去除不必要的根节点,从而避免了过拟合。对不同高校学生心理健康数据的分析结果说明,文中所提算法具有优良的适用性,且比现有算法的分析正确率更高,更具实用性。
    • 陈伟; 简川霞
    • 摘要: 针对有标记的训练样本数量较少会降低印刷套准识别模型性能的问题,本研究提出了基于安全样本过采样预处理和协同训练的半监督方法,以提升识别模型的性能。首先采用k近邻方法识别训练集中的安全样本。在安全样本间进行过采样,生成新的训练集。然后采用Bootstrap采样方法将新的训练集分成三个子训练集,学习得到三个决策树子分类模型,不断对无标记样本进行预测,并将其加入到子训练集,更新子分类模型,直至其能稳定为止。集成子分类模型,形成最终分类模型。实验结果表明,本研究方法随着训练样本数量的增多,分类性能也逐渐提高。当训练样本数量为800时,其在测试集上的分类准确率Accuracy达到98%,召回率的几何平均数G-mean为99%,在同样数量的训练样本上,均高于实验中的其他方法。本研究方法可以有效利用无标记样本,提高印刷套准识别模型的性能,实现数量较少的训练集样本的印刷套准识别。
    • 谢鑫; 张贤勇; 王旋晔; 唐鹏飞
    • 摘要: 针对现有决策树算法对连续性数据分类的信息丢失、效果不佳等缺点,提出一种邻域决策树(NDT)构造算法。首先,挖掘了邻域决策信息系统上的变精度邻域等价粒,并探讨了相关性质;然后基于变精度邻域等价粒构建邻域基尼指数度量,以度量邻域决策信息系统的不确定性;最后,用邻域基尼指数度量诱导出树节点的选取条件,并以变精度邻域等价粒为树分裂规则,从而构建NDT。在UCI数据集进行实验的结果表明,NDT算法的准确度比基于信息熵的决策树算法ID3、基于基尼指数的决策树算法CART、基于信息增益率的决策树(C4.5)算法和融合信息增益和基尼指数(IGGI)算法平均提高了20个百分点左右,验证了NDT算法的有效性。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号