分布式校园网垃圾信息识别系统的设计与开发

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

近年来，随着移动互联网技术与数字化校园建设的不断发展，校园网络互动平台已经成为师生交流的主要平台，其为师生提供便利的信息服务时，也成为了不法分子传播垃圾信息的主要阵地。并且这些垃圾信息已经对师生的正常学习生活以及校园文化建设带来了严重的威胁。如何将校园网络平台中的垃圾信息进行快速准确的识别，然后由相应过滤器，将其屏蔽处理已经成为现阶段校园安全建设刻不容缓的任务，本文主要研究工作如下：　　1)首先对Hadoop平台进行分析研究，发现其具有较高的可靠性、扩展性、容错性，且对硬件要求低等特性。选择其作为信息识别系统的应用平台。　　2)对当前常用的信息过滤算法进行分析比较，发现贝叶斯算法具有高效、简单易实现等优点。选择贝叶斯分类算法作为主要的信息识别算法。　　3)垃圾信息识别系统中，在文本分词、去噪阶段，改进TFIDF函数参数设置，将对分类影响权重低的特征量过滤掉，以降低系统的空间与时间成本；在分类阶段，为了降低将有效信息划分为垃圾信息的风险，在分类时引入最小风险因子，将信息划分到风险最小的类别中。　　4)在Hadoop平台上利用MapReduce与HBase等组件将改进的垃圾信息识别系统进行编程实现。特别是对训练与分类过程中Map与Reduce过程的编程实现。　　通过对分布式校园网垃圾信息识别系统进行性能实验对比后，发现引入Hadoop平台后，系统识别效率有了明显的提高；改进的基于最小风险贝叶斯分类与TFIDF融合的垃圾信息识别系统在识别率、查准率、精确率等方面都有较明显的改善。

著录项

作者
张利强;
展开▼
作者单位

西南科技大学;

展开▼
授予单位西南科技大学;
学科计算机技术
授予学位硕士
导师姓名潘娅,刘亚青;
年度 2018
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词
校园垃圾信息识别,MapReduce软件,贝叶斯算法,风险因子;

相似文献

中文文献
外文文献
专利

1. Internet/浏览器信息发布平台的设计与开发——校园网信息发布方案 [J] . 吴文武 ,王爱京 . 中国教育信息化：高教职教 . 1999,第0S1期
2. 整合校园网络安全信息——分布式安全信息发布系统简介 [J] . 郑先伟 . 中国教育网络 . 2007,第001期
3. 校园网络管理信息系统的设计与开发 [J] . 莫民 ,陈锐浩 . 信息系统工程 . 2014,第004期
4. 校园网设备管理信息系统开发方案与设计要点 [J] . 王登科 . 中国科技信息 . 2012,第011期
5. 基于校园网的低值易耗品管理信息系统的设计与开发 [J] . 王承明 ,袁玉清 ,殷元元 . 实验室研究与探索 . 2005,第012期
6. 校园网络管理信息系统的设计与开发 [C] . 潘冰 . 第十二届全国管理信息系统学术年会 . 1997
7. 校园网络多媒体信息发布系统的设计与开发 [A] . 祁潇 . 2011

分布式校园网垃圾信息识别系统的设计与开发

目录

摘要

著录项

相似文献

相关主题

期刊订阅