代价敏感学习
代价敏感学习的相关文献在2005年到2022年内共计117篇,主要集中在自动化技术、计算机技术、电工技术、经济计划与管理
等领域,其中期刊论文92篇、会议论文5篇、专利文献95406篇;相关期刊60种,包括管理科学、南京理工大学学报(自然科学版)、山西大学学报(自然科学版)等;
相关会议5种,包括信息系统协会中国分会第四届学术年会、2008年全国声学学术会议、第七届全国信号与信息处理联合会议暨首届全国省(市)级图象图形学会联合年会等;代价敏感学习的相关文献由311位作者贡献,包括刘小洋、叶舒、李祥等。
代价敏感学习—发文量
专利文献>
论文:95406篇
占比:99.90%
总计:95503篇
代价敏感学习
-研究学者
- 刘小洋
- 叶舒
- 李祥
- 邹鹏
- 曹鹏
- 苗琛香
- 付忠良
- 周志华
- 赵大哲
- 郝媛媛
- 万建武
- 何建敏
- 刘忠慧
- 卢晓
- 吉根林
- 吕成戍
- 吕明琪
- 周东华
- 宁彬
- 尹金良
- 康琦
- 张仲非
- 张凯
- 彭飞
- 方宇
- 李一军
- 李华雄
- 李文新
- 李玺
- 李秋洁
- 杨新
- 杨明
- 熊启军
- 王杨
- 王纯麟
- 王维国
- 王雪松
- 虞盛康
- 袁磊
- 谷琼
- 赵学义
- 钟尚平
- 陈开志
- 陈银娟
- 陈雨寒
- 马敏
- SHENG
- SONG Jian
- S.
- Victor
-
-
张悦;
宋海涛
-
-
摘要:
以机器学习和深度学习为代表的数据挖掘技术为日益加剧的财务造假现状的缓解提供了技术帮助,但财务造假识别所具备的类不平衡性和代价敏感性阻碍了学习性能的提高。文章基于代价敏感学习对国内上市公司展开财务造假识别研究:根据成因理论构建财务造假因子库;通过引入代价矩阵对轻型梯度提升决策树进行代价敏感改造,以误分类成本代替误分类率以实现损失最小化,构建财务造假识别模型;最后,以财务造假高发年2015年中国上市公司进行对比实验。实验结果表明,该算法在确保总体准确度的同时有效提升了财务造假公司的识别正确率,同时提出了基于"动机+现实+可能"的财务造假识别路径。
-
-
霍士伟;
田八林;
郭圣明;
师有为
-
-
摘要:
智能化战场态势评估是实现智能化作战指挥的基础和关键。随着机器学习的快速发展和在军事领域的广泛应用,以及战场数据获取能力的提高,基于机器学习的数据驱动的战场态势评估成为目前研究的热点。对战场态势评估的概念和基于机器学习的战场态势评估研究现状进行了概述,分析了现有基于机器学习的战场态势评估存在的问题,并对其解决思路和研究方法进行了展望。
-
-
姚丽;
崔超然;
马乐乐;
王飞超;
马玉玲;
陈勐;
尹义龙
-
-
摘要:
学生成绩预测旨在利用学生的相关信息预测其在未来的学业表现.随着校园信息化建设的持续推进,校园网络认证系统越来越完善,各高校逐步积累了丰富的学生校园上网行为数据.考虑到人的行为表现和学习能力密切相关,以校园上网行为感知为切入点,通过挖掘学生的上网行为日志来预测他们的成绩.为此,收集构建了一个同时包含学生校园上网行为和成绩数据的真实数据集,并通过数据分析证明两者之间确实存在一定的关联性.在此基础上,提出了一个端到端的双层自注意力网络(dual-level self-attention network,DEAN),引入级联式的自注意力机制来分别提取学生每一天的局部上网行为特征和长时间的全局上网行为特征,更好地解决了长行为序列建模问题.此外,通过多任务学习策略在统一的框架下同时解决面向不同专业的学生成绩预测问题,并设计了基于学生排名差的代价敏感损失来进一步提升方法的性能.实验结果表明:相比于传统的序列建模方法,所提出的方法具有更好的预测精度.
-
-
张金传;
张震
-
-
摘要:
软件缺陷预测通过学习软件缺陷历史数据建立缺陷预测模型,是开发可信软件的重要手段。现有的研究在学习不平衡软件缺陷数据时,确定合理的误分类代价是一个难以解决的问题。在代价敏感朴素贝叶斯方法的基础上拓展,提出一种动态调整模型参数的半监督学习方法——CSNB-EM(EM based Cost-Sensitive Naive Bayes)。该方法通过交叉验证搜索适合训练数据集的最优误分类代价,将搜索到的误分类代价用于建立分类模型,利用未标记数据迭代修正模型参数。方法利用未标记数据提高模型性能,同时克服了传统的软件缺陷预测中确定误分类代价的困难。基于AUC与GeoM评测指标在MDP软件缺陷数据集的5个项目上进行比较实验。实验结果表明,CSNB-EM与CS-NB、CS-NN等现有的代价敏感软件缺陷预测方法相比,其预测性能有明显提高。
-
-
谭凯文;
张立民;
闫文君;
徐从安;
凌青;
刘恒燕
-
-
摘要:
针对辐射源个体识别(SEI)中样本标签不完整和数据类别分布不平衡导致分类准确率下降的问题,该文提出了一种基于代价敏感学习和半监督生成式对抗网络(GAN)的特定辐射源分类方法。该方法通过半监督训练方式优化生成器和判别器的网络参数,并向残差网络中添加多尺度拓扑模块融合时域信号的多维分辨率特征,赋予生成样本额外标签从而直接利用判别器完成分类。同时设计代价敏感损失缓解优势样本导致的梯度传播失衡,改善分类器在类不平衡数据集上的识别性能。在4类失衡仿真数据集上的实验结果表明,存在40%无标记样本的情况下,该方法对于5个辐射源的平均识别率相比于交叉熵损失和焦点损失分别提高5.34%和2.69%,为解决数据标注缺失和类别分布不均条件下的特定辐射源识别问题提供了新思路。
-
-
彭科;
彭龑
-
-
摘要:
针对电信客户流失数据集的多维特征和不均衡问题,本文给出了一种基于代价敏感的逻辑回归的电信客户流失预测模型。通过对不平衡样本集分别采用不同权重调整,将代价敏感学习与传统分类算法相结合,建立基于逻辑回归的电信客户流失预测模型,最后对实际电信客户流失进行验证。通过与其他分类器模型的对比显示此方法在各种评估指标上均有更好的表现,更加符合电信业预测客户流失的实际情况。
-
-
马建梅;
陈承;
张星星;
姚倩
-
-
摘要:
为了全面、客观评价高校慕课教学质量,提出了基于支持向量机的高校慕课教学质量评价方法。首先通过分析高校慕课教学质量影响因素,建立高校慕课教学质量评价体系,然后采用支持向量机训练评价体系建立高校慕课教学质量评价模型。实验结果表明:该方法提升了高校慕课教学质量评价效果,输出评价结果与实际评价结果吻合度极高,教学质量评价客观、全面。
-
-
杨剑;
颜源;
李乐林
-
-
摘要:
针对云检测任务中云和背景样本不均衡易造成模型泛化能力差的问题,应用代价敏感学习方法,在卷积网络的损失函数中引入代价系数,同时使用F1分数代替总体精度指标进行模型选择,可有效克服样本不均衡问题.以高分一号影像为实验数据,提取了不同下垫面的云,验证了本方法的有效性.
-
-
曾嘉麒;
刘外喜;
卢锦杰
-
-
摘要:
数据中心网络中的流可以分为大象流和老鼠流,预测流类型是实现优化调度各种流的基础,而现有方法在开销、准确性、预测时间等方面都有或多或少的缺点.为此,利用深度学习具有的刻画多维度特征的能力以及软件定义网络(SDN)具有的全局集中控制的优势,提出了"边缘预分类+中心精分类"两级大象流预测机制.该机制包括以下步骤:首先,利用随机森林技术筛选出流在3个维度(时间分布特征、流的实时特征、数据包头部特征)10个用于构建预测模型的特征.然后,部署在SDN交换机上的预分类模型使用残差网络算法+带代价敏感性质的Softmax交叉熵损失函数,过滤掉大部分老鼠流.最后,部署在SDN控制器的精分类模型使用残差网络算法+Additive Margin Softmax交叉熵损失函数,准确地识别出大象流.面向公开数据集的实验表明,当流的第5个包到达时,所提机制的召回率可达91%,准确率可达93%,开销低至0.1kbps,预测时间低至7ms.与FlowSeer、ESCA、NELLY等现有主要方法对比,所提机制的各评价指标均有改善,马修斯相关系数MCC是NELLY的2.52倍,开销降低到ESCA的0.046%,预测时间减少到FlowSeer的0.35%.
-
-
卫志农;
石东明;
张明;
孙国强;
臧海祥;
沈培锋
-
-
摘要:
电网中不同设备的故障概率存在差异,影响智能诊断技术的准确性.为解决此问题,提出了一种基于代价敏感学习和模型自适应选择融合的电网故障事件智能识别方法.首先,利用Word2vec模型将预处理后的电网告警信息向量化,并搭建2个双向长短期记忆网络作为基础分类器;然后,设计代价敏感损失函数,将交叉熵损失函数与代价敏感损失函数分别应用于2个分类器中;最后,提出一种模型自适应选择融合法,融合上述分类器,得到故障事件识别结果.实际数据测试表明,所提方法能够有效降低故障事件识别中样本类别不平衡的影响.
-
-
-
-
刘胥影;
周志华
- 《2005第一届中国分类技术与应用研讨会(CSCA)》
| 2005年
-
摘要:
在机器学习和数据挖掘领域中,分类器通常设计为最小化测试样本的错误率,然而这只有在所有错误具有相同的错误分类代价时才有意义.在现实问题中,不同情况下的错误往往具有不同的代价,分类器应该设计为最小化总体错误分类代价.实现了一种基于示例加权的代价敏感k近邻方法,通过对不同类别的样本赋予不同的权值来获得代价敏感学习能力,其中样本的权值和其所在类别的错误分类代价成正比.实验结果表明,该方法在两类问题上能显著降低总体代价。
-
-
-
-
-
-
-
邹鹏;
李一军;
郝媛媛
- 《信息系统协会中国分会第二届学术年会》
| 2007年
-
摘要:
在基于价值的客户细分中,由于错误分类代价差异和不同价值客户数量的不平衡分布,基于总体准确率的数据挖掘方法不能体现由于客户价值不同对分类效果带来的影响。本研究在代价敏感性学习机制下引入支持向量机,建立基于客户价值的错分代价函数,将二元分类扩展为多元分类,建立分类的期望损失函数作为分类效果的评价标准。实验结果说明,该方法可以更精确地控制代价敏感性,降低总体的错误分类代价,使模型能更准确反映分类的代价,有效识别客户价值。
-
-
邹鹏;
李一军;
郝媛媛
- 《信息系统协会中国分会第二届学术年会》
| 2007年
-
摘要:
在基于价值的客户细分中,由于错误分类代价差异和不同价值客户数量的不平衡分布,基于总体准确率的数据挖掘方法不能体现由于客户价值不同对分类效果带来的影响。本研究在代价敏感性学习机制下引入支持向量机,建立基于客户价值的错分代价函数,将二元分类扩展为多元分类,建立分类的期望损失函数作为分类效果的评价标准。实验结果说明,该方法可以更精确地控制代价敏感性,降低总体的错误分类代价,使模型能更准确反映分类的代价,有效识别客户价值。