反馈增量学习算法及其在网络信息过滤中的应用研究

代理获取

页面导航

目录
摘要
著录项
引文网络
相似文献
相关主题

摘要

互联网的快速发展及电子信息的迅猛膨胀带来了严重的“信息爆炸”问题,用户可以通过网络获取到最新信息,同时,鉴于网络的开放性这一特点,用户就会不可避免的接触到暴力、色情、封建迷信、种族主义等等具有明显意识倾向的不良信息.准确高效的从浩如烟海的网络信息中获取用户的需求信息及过滤掉不感兴趣的垃圾信息,成为互联网发展亟需解决的问题.基于内容的信息过滤技术能够帮助人们检索到感兴趣的相关信息,同时过滤掉非法信息.然而,在网络信息过滤中,非法文本的内容有较强的时效性及突发性,且会随着时间、背景、地点等的不同而呈现不同的变化,必须实时更新过滤模板,才能反映这种变化,才能保证信息过滤系统的性能及效率.面对实时垃圾信息过滤新挑战,及时捕获用户最新需求信息,研究网络信息过滤中过滤模板增量学习方法,实时调整网络信息过滤模板,成为人们关注和研究的热点,有着深远的社会意义.
　　本文首先对网络信息过滤技术进行了研究探讨,针对基于内容的网络信息过滤技术中固定的过滤模板不能动态追踪实时用户需求的缺陷,论文结合反馈思想,提出了两种过滤模板的增量学习方法,并将其用到网络信息过滤系统中,以优化过滤效果,提高过滤的准确率.本文的工作总结主要包括以下三个方面:
　　1、利用改进的特征选择方法,提出了一种改进的过滤模板增量学习方法
　　该方法主要是通过收集正、负反馈集,并结合遗传算法,提出了改进的特征选择方法,对正负反馈集特征选择后,结合两者调整过滤模板的特征项权重.实验结果显示,过滤模板改进后较改进前,系统的整体性能有了很大程度的提高.
　　2、结合反馈增量学习思想,提出了一种基于朴素 Bayes分类的过滤模板反馈增量学习方法
　　该方法收集反馈集,并对反馈集进行训练之后,用提出的朴素Bayes分类的过滤模板反馈增量学习方法重新修正分类器,以使得分类器能够实时追踪用户需求,从而提高过滤准确率,经反复实验测试系统的整体稳定性,改进后分类器的整体性能稳定性相对较好,宏平均F1值都在80％以上,且最高值为90.32％.
　　3、结合反馈增量学习方法,设计并实现基于内容的网络信息过滤系统
　　将提出的反馈增量学习算法应用到网络信息过滤系统中,调整过滤模板特征项权重.实时捕获并更新用户需求,利用用户的最新需求信息增量优化Bayes分类器,最终实现网络不良信息的及时过滤,在保证系统整体稳定性的同时提高过滤准确率.

著录项

作者
许明英;
展开▼
作者单位

山东师范大学;

展开▼
授予单位山东师范大学;
学科计算机软件与理论
授予学位硕士
导师姓名尉永清;
年度 2012
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;算法理论;
关键词
网络信息过滤; 反馈增量学习算法; 特征选择;

相似文献

中文文献
外文文献
专利

1. 基于SVM的增量学习算法及其在网页分类中的应用 [J] . 周利萍 ,杨家红 ,黄务兰 . 计算机时代 . 2004,第011期
2. 模糊集技术在网络信息过滤系统中的应用研究 [J] . 尉永青 ,刘培德 . 西藏大学学报（社会科学版） . 2004,第004期
3. 结合模糊聚类的遗传算法在网络信息过滤中的应用 [J] . 陆宏菊 ,刘培玉 ,崔嘉 . 计算机应用 . 2008,第003期
4. 试谈视频反馈在网球教学中的应用研究 [J] . 杨亚星 ,洪伦 . 体育风尚 . 2017,第003期
5. 多级反馈队列调度算法及其在网络购票系统中的应用 [J] . 盛夏 ,刘祥伟 ,龙贺 . 软件导刊 . 2015,第009期
6. 集成学习算法在增量学习中的应用研究 [C] . 文益民 ,湖南工业职业技术学院 ,杨旸 . 2005第一届中国分类技术与应用研讨会（CSCA） . 2005
7. 遗传算法及其在网络信息过滤中的应用研究 [A] . 王乾龙 . 2012

反馈增量学习算法及其在网络信息过滤中的应用研究

目录

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅