基于信息熵抽样估计的统计学习查询策略

曲豫宾; 陈翔

首页> 中文期刊>通化师范学院学报 >基于信息熵抽样估计的统计学习查询策略

基于信息熵抽样估计的统计学习查询策略

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

主动学习查询策略有助于从未标注数据中选择能够提高分类模型性能指标的样例,减少人工标注陈本,基于期望损失最小化的主动学习查询策略有助于选择未标注实例,然而该策略存在计算复杂度高,随机采样性能不稳定等问题,因此,从信息熵具有较强衡量未标注样本的信息量出发,提出基于信息熵抽样估计的统计学习查询策略,该策略使用已标注样例得到的训练模型对未标注实例池中每个样例计算信息熵,选择若干不确定度最高样例并计算相应数据分布的期望经验风险,选择使期望经验风险最小的样例进行标注.在公开的UCI机器学习数据集(包括tic-tac-toe、transfusion、kr-vs-kp、diagnosis、breast-cancer等)上针对不同标注比例(比如20%、40%、60%、80%、100%),以及不同的分类器(比如随机森林、逻辑斯蒂回归等)进行实证研究表明,相对于随机采样策略,该策略计算复杂度从O(N2)降低为O(Q×N),ACCURACY指标在最好情况下最高提升6%.

著录项

来源
《通化师范学院学报》|2019年第12期|66-72|共7页
作者
曲豫宾; 陈翔;
展开▼
作者单位

江苏工程职业技术学院江苏南通226007;

南通大学;

展开▼
原文格式 PDF
正文语种 chi
中图分类软件工程;
关键词
信息熵; 主动学习; 统计学习;
入库时间 2023-07-25 11:03:07

相似文献

中文文献
外文文献
专利

1. 基于统计学习人脸识别的抽样分析 [J] . 卫小强 . 电脑知识与技术 . 2017,第018期
2. 基于用户查询与样本间匹配度评估的分层抽样策略 [J] . 邬志罡 ,荆一楠 ,何震瀛 . 计算机应用与软件 . 2019,第008期
3. 一种高效准确的基于查询结果的基数估计策略 [J] . 高锦涛 ,李战怀 ,刘文洁 . 西北工业大学学报 . 2018,第004期
4. 基于多重抽样框的连续性抽样估计方法研究 [J] . 贺建风 . 统计研究 . 2012,第010期
5. 基于双重抽样框的抽样估计方法研究 [J] . 贺建风 . 统计研究 . 2011,第012期
6. 基于多重抽样框的连续性抽样估计方法研究 [C] . 贺建风 . 第十六次全国统计科学讨论会 . 2011
7. 统计学习算法：多分类及非独立同分布抽样下的回归 [A] . 潘志伟 . 2009

基于信息熵抽样估计的统计学习查询策略

摘要

著录项

相似文献

相关主题

期刊订阅