决策树
决策树的相关文献在1980年到2023年内共计6962篇,主要集中在自动化技术、计算机技术、经济计划与管理、无线电电子学、电信技术
等领域,其中期刊论文5551篇、会议论文269篇、专利文献28077篇;相关期刊1858种,包括电脑知识与技术、福建电脑、计算机工程等;
相关会议240种,包括2016电力行业信息化年会、中国水利学会2010年空间信息技术在水利领域应用研讨会、2010国际信息技术与应用论坛等;决策树的相关文献由15382位作者贡献,包括刘海涛、金平艳、胡成华等。
决策树—发文量
专利文献>
论文:28077篇
占比:82.83%
总计:33897篇
决策树
-研究学者
- 刘海涛
- 金平艳
- 胡成华
- 王伟
- 王鹏
- 王磊
- 王勇
- 王熙照
- 李伟
- 王力
- 王超
- 朱俚治
- 李勇
- 李艳
- 王斌
- 王鑫
- 马丽
- 刘军
- 张军
- 张宇
- 柳炳祥
- 刘佳
- 刘斌
- 周俊
- 张伟
- 张敏
- 李宁
- 翟俊海
- 张华
- 张明
- 李莉
- 王刚
- 王强
- 田雨农
- 胡学钢
- 赵静娴
- 黄启军
- 刘勇
- 张涛
- 张磊
- 张鑫
- 张阳
- 方文静
- 李明
- 杜丽英
- 王健
- 王清
- 王琳
- 王静
- 迟庆云
-
-
官松美;
叶志荣;
邓莉;
杨全;
李柳珠;
兰媛媛;
路晓钦
-
-
摘要:
目的探究注射用七叶皂苷钠不良反应(ADR)的流行病学特点及ADR发生的相关因素。方法选取重庆市2014—2019年注射用七叶皂苷钠ADR报告为调查对象,对合格上报的1391例ADR进行流行病学统计,对符合纳入条件的1338例ADR报告采用决策树、关联规则法进行ADR特点分析。结果七叶皂苷钠ADR累及系统与患者性别、年龄、给药途径、用药原因等因素相关。ADR发生时间主要集中在用药后10~30 min和1~3 d这2个时间段。结论七叶皂苷钠ADR临床较为常见,应充分了解该药ADR发生原因和特点以保证临床用药安全有效。
-
-
朱先鸿;
王星捷;
袁伟强
-
-
摘要:
青藏高原分布着全球海拔高、数量多、面积大的高原湖泊群,这些湖泊的变化能够真实地反映出区域的气候与环境状况。科学地分析湖泊演变规律将为区域环境与气候的研究提供关键的数据支撑。在以往的相关研究中,基于湖泊水域面积的分析方法大多利用ENVI等相关软件进行处理,处理过程较繁琐,需要耗费大量的时间。文中基于以上问题,设计与实现了青藏高原的湖泊水域面积提取系统,该系统充分利用地理信息及遥感技术,结合经典机器学习算法支持向量机(SVM)、决策树对湖泊水域进行智能提取,实现对青藏高原湖泊群水域面积的统计,揭示出其演变规律。通过实验分析得出,在2016年到2020年,青藏高原湖泊的面积呈增长趋势,与前人的研究保持一致,为湖泊水域面积的提取提供了技术参考和实现方法。
-
-
宋明;
刘芸宏;
吴晓慧;
李倩;
王书会
-
-
摘要:
目的 基于决策树卡方自动交互检测(CHAID)算法和神经网络分析脑卒中手术患者医院感染危险因素,为早期筛查医院感染高危人群提供科学依据。方法 前瞻性收集2016年1月-2019年12月某三级甲等医院进行脑卒中手术患者的临床资料,应用CHAID算法和神经网络分析脑卒中患者医院感染的危险因素,并与多元logistic回归分析进行比较。用受试者工作特征曲线(ROC)下面积(AUC)比较不同模型的预测效果。结果 共纳入脑卒中手术患者1124例,医院感染269例,医院感染发生率为23.93%;决策树和神经网络分析均显示留置胃管、住院时间和静脉血栓是脑卒中手术患者医院感染的危险因素,决策树模型预测的正确率为81.1%,ROC曲线下面积为0.821(95%CI:0.799~0.848);神经网络模型预测的正确率为86.2%,ROC曲线下面积为0.874(95%CI:0.852~0.894);通过比较,两模型预测效果好,存在的差异有统计学意义(Z=5.565,P<0.001)。结论 神经网络分析模型预测效果优于决策树模型,两模型分别从不同层面探究脑卒中患者医院感染的危险因素,便于早期筛查医院感染的高危患者,开展有效的预防控制措施,降低医院感染的发生率。
-
-
邢强;
张晋言;
王镇方;
马睿;
姜文宗;
刘宝弟;
王延江
-
-
摘要:
传统的测井解释规则库的获取需专业研究人员以手工方式进行,存在繁琐、耗时等缺点,且技术熟练程度直接影响到解释评价效果,为此,提出了一种基于XGBoost的测井解释规则库自动获取或建立测井解释专家规则库的方法,将多种物理信息和地质参数作为输入特征,储层类别作为输出标签,通过引入XGBoost算法,经过学习得出地质参数与储层类别之间的关系模型。利用该模型,可以自动预测储层类别,进而建立测井解释规则库。胜利油田盐家永安地区某砂砾岩油气藏的砂砾岩测井解释评价结果表明,与支持向量机(SVM)算法和梯度提升决策树(GBDT)算法相比,本文方法具有更高的准确率和更高的计算效率。研究区老井复查结果表明:与手工获取规则库方法相比,本文方法较完整地提取了研究区内的知识规则,提升了测井解释的准确率。
-
-
史鹏;
孙金月
-
-
摘要:
目的:NCP肺炎疫情致使我国部分居民出现替代性创伤(VT),期望从身体活动增进心理健康的角度出发,为减轻心理应激提供建议。方法:采用IPAQ长卷和IES-R量表对我国5个省份15个城市居民身体活动水平和VT进行调查,通过χ^(2)检验调查影响我国居民VT的影响因素,通过决策树模型对居民VT进行识别。结果:不同身体活动水平(χ^(2)=6.575,P=0.037)、居住地病例(χ^(2)=3.945,P=0.047)、最高学历(χ^(2)=28.586,P=0.000)居民出现替代性创伤的比例具有显著性差异,且高体力活动水平、居住地病例在30例以下、专科及以下学历人群出现替代性创伤的可能性更低;决策树模型(深度4,节点13,终端节点7,准确率79.9%)认为本科及研究生学历且居住地病例在31例以上居民高身体活动水平出现替代性创伤的可能性较低,而高身体活动水平且25岁以下特征居民也有出现替代性创伤的可能性。结论:高身体活动水平居民出现VT的可能性较低,但其与年龄、居住地病例和最高学历存在交互作用,建议相关特征居民减少疫情信息输入,转移注意力,适当提高身体活动水平,改善负面情绪,减轻应激反应。
-
-
刘胜娃;
曹湘华
-
-
摘要:
有效地提高钻井工作的安全性与生产稳定性,是当前钻井工作发展过程中面临的一个重要问题。本文针对钻井工况识别问题,基于钻井过程中多项监测数据,提出了一种基于决策树的钻井工况智能识别方法,并采用朴素贝叶斯算法、支持向量机以及钻井现场的实际钻井数据对该方法的有效性和准确性进行对比、验证,发现基于决策树的工况识别正确率最优且达到了97%。实验结果表明该方法能够实现钻井工况的智能识别,在一定程度上满足油田数字化与智能化的需求。
-
-
常硕;
张彦春
-
-
摘要:
随机森林在bootstrap的基础上通过对特征进行抽样构建决策树,以牺牲决策树准确性的方式来降低决策树间的相关性,从而提高预测的准确性。但在数据规模较大时,决策树间的相关性仍然较高,导致随机森林的性能表现不佳。为解决该问题,提出一种基于袋外预测的改进算法,通过提高决策树的准确性来提升随机森林的预测性能。将随机森林的袋外预测与原特征相结合并重新训练随机森林,以有效降低决策树的VC-dimension、经验风险、泛化风险并提高其准确性,最终提升随机森林的预测性能。然而,决策树准确性的提高会使决策树间的预测趋于相近,提升了决策树间的相关性从而影响随机森林最终的预测表现,为此,通过扩展空间算法为不同决策树生成不同的特征,从而降低决策树间的相关性而不显著降低决策树的准确性。实验结果表明,该算法在32个数据集上的平均准确率相对原始随机森林提高1.7%,在校正的paired t-test上,该方法在其中19个数据集上的预测性能显著优于原始随机森林。
-
-
王佳齐;
杨思宇
-
-
摘要:
针对大学生心理健康问题相关数据的采集与分析需求,文中提出了一种基于大数据匹配的心理健康因素分析算法。通过数据的采集与预处理,实现社交模型、情感模型和兴趣模型的融合。文中分析计算了信息数据集合信息熵与信息增益率,利用剪枝决策树算法,可在最大程度分析处理相关数据的同时,使用后向剪枝理论去除不必要的根节点,从而避免了过拟合。对不同高校学生心理健康数据的分析结果说明,文中所提算法具有优良的适用性,且比现有算法的分析正确率更高,更具实用性。
-
-
陈伟;
简川霞
-
-
摘要:
针对有标记的训练样本数量较少会降低印刷套准识别模型性能的问题,本研究提出了基于安全样本过采样预处理和协同训练的半监督方法,以提升识别模型的性能。首先采用k近邻方法识别训练集中的安全样本。在安全样本间进行过采样,生成新的训练集。然后采用Bootstrap采样方法将新的训练集分成三个子训练集,学习得到三个决策树子分类模型,不断对无标记样本进行预测,并将其加入到子训练集,更新子分类模型,直至其能稳定为止。集成子分类模型,形成最终分类模型。实验结果表明,本研究方法随着训练样本数量的增多,分类性能也逐渐提高。当训练样本数量为800时,其在测试集上的分类准确率Accuracy达到98%,召回率的几何平均数G-mean为99%,在同样数量的训练样本上,均高于实验中的其他方法。本研究方法可以有效利用无标记样本,提高印刷套准识别模型的性能,实现数量较少的训练集样本的印刷套准识别。
-
-
谢鑫;
张贤勇;
王旋晔;
唐鹏飞
-
-
摘要:
针对现有决策树算法对连续性数据分类的信息丢失、效果不佳等缺点,提出一种邻域决策树(NDT)构造算法。首先,挖掘了邻域决策信息系统上的变精度邻域等价粒,并探讨了相关性质;然后基于变精度邻域等价粒构建邻域基尼指数度量,以度量邻域决策信息系统的不确定性;最后,用邻域基尼指数度量诱导出树节点的选取条件,并以变精度邻域等价粒为树分裂规则,从而构建NDT。在UCI数据集进行实验的结果表明,NDT算法的准确度比基于信息熵的决策树算法ID3、基于基尼指数的决策树算法CART、基于信息增益率的决策树(C4.5)算法和融合信息增益和基尼指数(IGGI)算法平均提高了20个百分点左右,验证了NDT算法的有效性。
-
-
Zeng Dexian;
曾德贤;
Feng Guoying;
冯国英
- 《第20届中国系统仿真技术及其应用学术年会(20th CCSSTA 2019)》
| 2019年
-
摘要:
航天器运行在太空环境中,受设计缺陷、使用年限、太空环境等因素的影响,很容易出现各种难以预测的故障.根据长期的经验总结发现,航天器状态与其运行数据具有一定的相关联系,航天器发生异常时一般伴有航天器状态的突变或缓变.将决策树方法应用到航天器状态判断与故障分析中,基于ID3算法对航天器太阳帆板遥测数据进行分析,构建出相关性决策树,直观显示出数据间的关联性,发现隐藏于航天器数据中的规则知识,从而判定影响航天器太阳帆板运行状态和性能的关键因素,为及时了解太阳帆板状态以及航天器在轨性能分析提供了必须的决策信息.
-
-
张少帅;
张耀升
- 《第9届全球华人探究学习创新应用大会》
| 2018年
-
摘要:
本文在783条某市“国培计划”参训小学教师学情记录的基础上,通过C4.5算法构建了成绩预测的决策树模型.根据检验,该决策树模型对总成绩分类进行预测的准确率达到了92.69%,有很好的预测效果,可以有效地根据教师部分模块的成绩预测教师总成绩的分布范围.
-
-
刘永阳;
钟秋添;
曹晶
- 《福建省电机工程学会2018年学术年会》
| 2018年
-
摘要:
在应对规范化的电网监控告警信息中,机器学习能够发挥其智慧化的优势,模拟人类对信息的思考,加强对信息的处理,提高监控效益.文章通过智能过滤监控告警信息的例子,探讨利用决策树学习方法过滤信号,并分析其智慧程度、安全性能和经济效益.
-
-
-
-
王霁吟;
陈懿妮;
孙长;
王丽颖;
俞佩
- 《2018第八届南海风云论坛》
| 2018年
-
摘要:
利用浙江省2004-2013年3-8月Micaps(气象信息综合分析处理系统)地面填图数据和T-logP数据研究杭州、衢州和台州三市的阵雨和雷雨个例,同时选取能表征雷雨并能区分阵雨与雷雨的气象预报因子:对流有效位能(CAPE)、850hPa与500hPa的温差(T8-5)、K指数(K)、地面2米温度(T0),用临近探空的分析方法和决策树的分类方法初步建立了一个适用于浙江省春夏季降水性质分类指标.利用欧洲中心(ECMWF)细网格预报资料,对历史样本和2016年春夏季分别作了检验.结果表明:除去有降水预报误差个例后,指标TS评分超过0.53,雷雨阵雨综合命中率达到71%,空报率阵雨(10%)小于雷雨(43%),在不同地区和季节稍有区别;同时对浙江省2016年春夏两次典型大范围阵雨雷雨过程进行预报,效果很好.此方法不仅可以依据预报数据在短期内做出精细化降水性质分类预报,在中长期预报上也有表现力.
-
-
薛良玉;
田君;
孙维超;
张文龙;
毕天琪;
张易成
- 《第四届全国石油石化行业信息化创新发展论坛》
| 2018年
-
摘要:
数字化油田的建设,数据呈爆发式增长,如何从数据中及时发现异常工况、分析原因进而采取针对性措施保证油井的正常生产,是油田管理者的重要任务.对此采用大数据分析技术,开展了油井生产工况诊断及智能预警研究;经特征参数提取,样本训练,利用决策树算法,构建了油井常见工况智能诊断模型,并开发了3D示功图叠加功能及多种工况趋势预测模型,建立实时预警、闭环控制机制,经现场应用,诊断准确率达90%以上.
-
-
郝晶;
冯伟荣;
王洪旭;
张曦
- 《第四届全国石油石化行业信息化创新发展论坛》
| 2018年
-
摘要:
本文选用炼化企业某大区公司一年交易数据为样本,从现有客户流失状态分析出发,识别现有客户流失特征,并运用数据挖掘C5.0算法,该算法采用实际业务需求和boosting与交叉验证相结合方法,对炼化客户建立流失预测模型.实际研究结果表明所使用的挖掘技术获得了满意的预测效果.
-
-
Shi Hongxun;
施红勋;
Wang Xiu-xiang;
王秀香
- 《2017中国化工学会年会暨成立95周年纪念大会》
| 2017年
-
摘要:
针对当前石油化工企业装置安全生产管理现状,为了提升石化装置过程安全管理水平,借鉴国内外过程安全管理体系和相关标准要求,本文提出了一种采用基于关联度的决策树算法来构建石化装置过程安全管理评估指标体系,同时运用多层次综合模糊评价方法建立了评估模型,给出了评估流程,设计开发了装置过程安全管理评估系统.应用表明,该技术可量化分析装置过程安全管理薄弱环节,有助于过程安全管理改进和水平提升,对保障装置安全稳定运行,提升装置安全管控水平具有现实意义.
-
-
莫遥;
梁铸;
吴波;
陈翔
- 《中国电子学会第二十四届信息论学术年会》
| 2017年
-
摘要:
P2P流量是近年来网络上较常见且难以识别的一种流量,本文针对这种流量提出了一种综合已有方法且结合报文首部统计特征分类与数据分块思想的新型高效识别方法.该方法通过统计报文首部ASCII码出现的频率,提取出一个256维的特征,使用决策树算法对流量进行分类识别.在识别的过程中,本文进一步提出数据分块的思想,获取更准确的统计特征,以提高识别的正确率.测试结果表明,该方法可以在多种流量混杂的情况下高效识别出P2P流量,且具有较高的准确度.