一种基于Q-学习算法的增量分类模型

刘凌云; 钱辉; 邢红杰; 董春茹; 张峰

首页> 中文期刊> 《计算机科学》 >一种基于Q-学习算法的增量分类模型

一种基于Q-学习算法的增量分类模型

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

大数据时代的数据信息呈现持续性、爆炸性的增长,为机器学习算法带来了大量监督样本.然而,这对信息通常不是一次性获得的,且获得的数据标记是不准确的,这对传统的分类模型提出了挑战,而增量学习是一种重要的解决方法.但在增量学习中,样本的标记顺序将严重影响分类器的性能,特别是在分类器分类能力较弱的情况下,传统的增量学习方法容易过早地将噪声数据添加到训练集上,从而影响分类器的精度.为解决这个问题,文中提出一种基于Q-学习算法的增量分类模型.该模型利用强化学习中经典的Q-学习算法来合理选择样本增量序列,削弱噪声数据的负面影响,并实现在学习过程中自主标记样本.同时,为了解决当新增未标记样本集规模较大时,Q-学习中的状态空间与动作空间增大带来的计算复杂度和存储空间呈指数增长的问题,文中进一步给出了批量增量分类模型,有效降低了模型的计算复杂度并节约了存储空间.基于Q-学习算法的增量分类模型融合了增量学习及强化学习的思想,具有分类精度高、实时性强等优点.最后,在3个UCI数据集上进行实验来验证所提模型的有效性,结果表明该模型通过选择新增训练集合的确有助于提升分类器的精度,且由不同增量序列训练得到的分类器精度也有较大差异.基于Q-学习算法的增量分类模型可以利用已有的少量监督信息进行初始训练,通过自主标记样本构造增量训练集,并通过自监督的方式提高分类器的精度.因此,基于Q-学习算法的增量分类模型可被用于解决监督信息缺乏的问题,具有一定的应用价值.

著录项

来源
《计算机科学》 |2020年第8期|171-177|共7页
作者
刘凌云; 钱辉; 邢红杰; 董春茹; 张峰;
展开▼
作者单位

河北大学数学与信息科学学院河北省机器学习与计算智能重点实验室河北保定 071002;

河北大学数学与信息科学学院河北省机器学习与计算智能重点实验室河北保定 071002;

河北大学数学与信息科学学院河北省机器学习与计算智能重点实验室河北保定 071002;

河北大学数学与信息科学学院河北省机器学习与计算智能重点实验室河北保定 071002;

河北大学数学与信息科学学院河北省机器学习与计算智能重点实验室河北保定 071002;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
增量学习; Q-学习; 在线学习; 分类; 强化学习;

相似文献

中文文献
外文文献
专利

1. 一种新的基于SVM的文本分类增量学习算法 [J] . 曹建芳 ,王鸿斌 . 电子商务 . 2009,第012期
2. 一种基于增量学习型矢量量化的有效文本分类算法 [J] . 王修君 ,沈鸿 . 计算机学报 . 2007,第008期
3. 一种基于概率粗糙集模型的增量式规则学习算法 [J] . 付长龙 ,杜旭辉 ,姚全珠 . 计算机科学 . 2008,第005期
4. 基于一种多分类半监督学习算法的驾驶风格分类模型 [J] . 李明俊 ,张正豪 ,宋晓琳 . 湖南大学学报（自然科学版） . 2020,第004期
5. 基于近邻分类的增量学习分类算法研究 [J] . 叶青 ,卢梓豪 ,周洁 . 计算机工程与应用 . 2016,第020期
6. 基于Q-学习和粒子群算法的区域交通控制模型 [C] . 魏赟 ,邵清 . 2011年全国生命系统建模仿真学术年会 . 2011
7. 基于Q-学习算法的序列决策模型研究 [A] . 刘凌云 . 2019

一种基于Q-学习算法的增量分类模型

摘要

著录项

相似文献

相关主题

期刊订阅