您现在的位置: 首页> 研究主题> 集成学习

集成学习

集成学习的相关文献在1995年到2023年内共计2247篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、电工技术 等领域,其中期刊论文1450篇、会议论文38篇、专利文献232202篇;相关期刊569种,包括计算机工程、计算机工程与科学、计算机工程与设计等; 相关会议33种,包括第十三届全国信息隐藏暨多媒体信息安全学术大会、第十二届全国信息隐藏暨多媒体信息安全学术大会、第二十五届全国信息保密学术会议(IS2015) 等;集成学习的相关文献由6333位作者贡献,包括周志华、焦李成、付忠良等。

集成学习—发文量

期刊论文>

论文:1450 占比:0.62%

会议论文>

论文:38 占比:0.02%

专利文献>

论文:232202 占比:99.36%

总计:233690篇

集成学习—发文趋势图

集成学习

-研究学者

  • 周志华
  • 焦李成
  • 付忠良
  • 马文萍
  • 刘洋
  • 周钢
  • 李伟
  • 王爽
  • 刘三民
  • 刘伟
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

作者

    • 刘星; 赵建印; 朱敏; 张伟
    • 摘要: 针对装备各类故障样本分布不平衡、现有算法故障诊断精度较低的问题,通过引入p范数约束多核极限学习机和基于AdaBoost的集成学习策略,定义了一种p范数约束下正则化加权多核集成极限学习机的故障诊断模型.首先,在p范数约束下,基于各类故障样本自身规模,分别进行了两种自适应的样本权重分配;其次,在每层分类器的优化中,将多核学习的多源数据融合能力和极限学习机运算高效的特点相结合,同时,将样本的权重W更新融入到多核极限学习机的优化进程;最后,通过Adaboost集成策略,自适应提升富含信息的样本在模型中的权重,从而显著提升故障诊断的精度.以6个UCI公共数据集以及1个实装案例为例,进行了故障诊断实验.结果 表明,与核极限学习机、加权核极限学习机(使用W(1)和W(2)加权方式)以及多核极限学习机(在1范数和p范数约束下)相比,诊断精度有显著提升;范数约束形式对模型的诊断性能影响有限.
    • 蒋杰伟; 雷舒陶; 耿苗苗; 巩稼民; 朱泽昊; 张运生; 刘芳; 吴艺杰; 王育文; 李中文
    • 摘要: 糖尿病视网膜病变(DR)已成为全球4大主要致盲疾病之一,及早确诊可以有效降低患者视力受损的风险。通过融合深度学习可解释性特征,提出一种DR自动诊断方法,首先利用导向梯度加权类激活映射图和显著图两种可解释性方法生成不同标记的病灶图像,再通过卷积神经网络提取原图像和两种生成图像的特征向量,最后融合3种特征向量并输入到支持向量机中以实现DR的自动诊断。在1443张彩色眼底图像构成的数据集上,相对于基础ResNet50模型,该方法诊断准确率提高3.6%,特异性提高2.4%,灵敏度提高5.8%,精度提高4.6%,Kappa系数提高7.9%,实验结果表明该方法能有效降低误诊的风险。
    • 贺指陈
    • 摘要: 在数据分类分析中,一些特别的类别里往往存在更重要的信息。提出一种基于集成学习,欠采样和代价敏感的类别不平衡数据分类算法(USCensemble),来解决传统算法处理类别不平衡数据分类任务时难以正确识别少数类样本的问题。该算法首先运用EasyEnsemble的算法结构,在前一组数据训练完毕后,运用欠采样方法选取权重大的多数类样本,并将其与少数类样本结合为临时训练数据以此平衡数据集并进行下一轮训练。同时赋予少数类样本更大的错分代价,快速提高错误分类的少数类的样本权重,降低多数类的样本权重,使算法更倾向少数类的正确分类,达到对少数类样本正确识别的目的。在10个uci的数据集生成的分类任务上进行了对比实验,实验结果表明,该算法能更好地识别少数类样本。
    • 方佳锴
    • 摘要: 为应对不均衡分类问题,提高分类准确率,提出了一种基于高斯混合模型的混合采样集成方法 GMHSE(GaussianMixture-model-based Hybrid Sampling Ensemble method),首先通过高斯混合模型将数据划分成多个类簇,然后在每个类簇上混合采样获得多个数据子集,最后基于Bagging技术在类簇内和类簇间进行加权投票完成分类预测。GMHSE通过聚类将对数据进行划分,混合采样保障在不丢失数据信息的同时获得均衡数据集,最后利用集成学习进一步提升模型的泛化性能。实验结果表明,相比已有的一些处理方法,GMHSE可以提升不均衡数据的分类性能。
    • 韦惠红; 李剑; 张文言; 雷建军; 陈璇
    • 摘要: 提前24 h准确预测PM_(2.5)浓度可以有效的避免严重污染天气对人体带来的不利影响.为了提高深度学习模型PM_(2.5)浓度24 h预测的性能和泛化能力,在传统循环神经网络(RNN)模型上添加支持向量回归(SVR)作为下采样层提取非线性特征并降维;然后添加多核卷积神经网络(CNN)提升特征表达能力;最后利用门控循环网络(GRU)可记忆时间序列中长期信息的优势进行时序预测以保证结果的稳定性.对集成SVR-CNN-GRU模型,以2015年1月1日至2020年4月10日武汉及其周边13城市的空气质量数据和地面气象数据为样本进行实例验证,结果表明,SVR-CNN-GRU在武汉市PM_(2.5)24 h预测上的表现明显优于集成之前的RNN、SVR和随机森林回归方法,而且泛化能力更强,拟合优度达到0.97,能够实现高准确度预测,达到提前24 h预警的目的.
    • 韩海韵; 杨有龙; 孙丽芹
    • 摘要: 针对许多多示例算法都对正包中的示例情况做出假设的问题,提出了结合模糊聚类的多示例集成算法(ISFC)。结合模糊聚类和多示例学习中负包的特点,提出了“正得分”的概念,用于衡量示例标签为正的可能性,降低了多示例学习中示例标签的歧义性;考虑到多示例学习中将负示例分类错误的代价更大,设计了一种包的代表示例选择策略,选出的代表示例作为基分类器的训练子集;结合各基分类器的结果,确定包的最终标签。ISFC算法对正包中正示例的比例未做任何假设,同时能够解决正包数量多、负包数量少情况下的类别不平衡问题。实验结果表明,ISFC在药物分子活性预测、图像分类、文本分类任务上都取得了较好的分类效果。
    • 张田华; 罗康洋
    • 摘要: 我国证券市场中高送转题材股备受中小投资者的追捧,但市场中也存在着借高送转概念炒作的乱象,如何利用上市公司的财务数据挖掘真正有潜力的股票无疑具有重要意义。采用2158家制造业上市公司7年的财务指标作为研究数据,利用采样、特征选择以及集成学习算法构建上市公司高送转预测模型并进行实证研究。结果显示:采样和特征选择方法均能有效提高集成预测模型的性能;相较于数据集中的冗余信息,数据不平衡问题对模型预测准确率的影响更显著;ADASYN+mRMR+XGBoost组合模型取得了最好的预测结果,高送转样本的分类准确率达到84.96%,建议投资者优先选用该组合模型对上市公司的高送转情况进行预测。
    • 王方伟; 陈景雅; 谢敏慧; 石宝存
    • 摘要: 针对交通流数据非线性和时序性特点,综合考虑天气因素与交通流量的潜在关系,提出一种基于主成分分析法(PCA)、灰色关联分析法(GRA)和自适应提升(adaptive boosting,AdaBoost)算法相结合的预测模型.首先利用PCA对样本进行降噪处理,再采用GRA计算各天气因素和交通流的非线性关联度,将灰色关联系数大于0.6的相关性强的特征变量输入到AdaBoost集成模型中,进行了模型简化.实验结果表明:与长短期记忆神经网络(LSTM)、分类回归树(CART)、自回归积分滑动平均模型(ARIMA)以及未被优化的AdaBoost集成模型对比,提出的PCAGRA-AdaBoost模型在预测误差和确定系数等指标方面均优于其他传统算法,体现了较高的预测精度.
    • 郑承宇; 王新; 王婷; 徐权峰
    • 摘要: 针对医疗文本语义稀疏、维度过高的问题,提出一种基于迁移学习和集成学习的多标签医疗文本分类算法(Trans-LSTM-CNN-Multi,TLCM)。该算法采用ALBERT(A Lite BERT)模型内部的多层双向Transfomer结构对大型语料库展开训练,获取通用领域的文本动态字向量表示。然后,利用医学领域目标数据集通过迁移学习和模型微调技术实现ALBERT预训练语言模型在医学领域的文本语义增强。在此基础上,将上述通过迁移学习得到的文本语义增强模型输入到Bi-LSTM-CNN集成学习模块,进一步提取医学文本内容的重要信息特征。最后,基于二元交叉熵损失函数构造文本多标签分类器实现医疗文本分类。实验结果表明,通过迁移学习和集成学习的TLCM文本分类算法能有效提升医疗文本的分类性能,在中文健康问句数据集上整体F1值达到了91.8%。
    • 蒋锋; 张文雅
    • 摘要: 机器学习方法在处理复杂数据、构建高精度模型方面具有显著优势,在不同领域的研究中都得到了广泛应用。数字经济时代为经济领域带来海量数据的同时,也对经济研究提出诸多挑战。机器学习方法能充分挖掘数据中的非线性、非平稳信息,有效提高经济分析结果的精度。机器学习与经济问题的融合改变了传统经济学的研究范式。文章对近年来机器学习方法在经济研究中的应用进行回顾,从通货膨胀、汇率与货币、GDP、劳动力市场、社会稳定、政策评价等角度进行总结,比较了常用机器学习方法的优缺点,并展示了模型的评价准则,如均方根误差、F1-得分、AUC值等。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号