基于一类SVM的网络不良信息过滤算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

互联网的高速发展使得通过网络传输的文件监控和过滤成为一个热门课题。这些文件中可能包含了不良信息。网络流量中的信息包含着各种网络协议,可能被分片,编码。机器无法直接识别其中的需要监控的内容。而对于内容过滤,使用传统的基于字符串匹配的算法显然无法满足呈几何爆炸级别的信息增长的监管需求。虽然使用SVM确实可以提高分类效率,但依然存在维数过大,导致存储资源和计算能力浪费的现象。
　　本文首先分析如何在众多网络协议中,根据协议本身的特点和协议状态机,对协议中包含的传输内容进行自动识别匹配,然后对数据流部分进行重组还原,并且进行必要的解码操作,以获得需要过滤的文本信息。本文重点研究了主流的应用层HTTP协议,FTP协议,SMTP协议和POP3协议,以及主流的私有应用飞信协议,QQ协议和MSN协议。然后本文提出了一种针对如何有效减少 SVM的维数的改进算法,提出通过使用三种特征简约对向量机的维数进行约束。这种算法的改进达到加快运算速度,节省存储空间、提高准确率的作用。
　　实验表明在选用相同数量的特征词的前提下,基于文档频率,基于信息增益和开方拟合算法取舍向量机的特征值各有优缺点。在仅仅选取500个特征值的情况下,改进算法使得不良信息分类和过滤的正确率达到了80％以上。在选取超过1000个特征值的情况下,DF算法的正确率超过了90%。

著录项

作者
丁霄云;
展开▼
作者单位

上海交通大学;

展开▼
授予单位上海交通大学;
学科信息与通信工程
授予学位硕士
导师姓名刘功申;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类数据通信网;通信规程、通信协议;
关键词
支持向量机; 特征简约; 网络协议; 数据重组; 网络不良信息; 过滤算法;

相似文献

中文文献
外文文献
专利

1. 基于CS-SVM与Bagging的垃圾邮件过滤算法研究 [J] . 边吉荣 . 宁夏工程技术 . 2008,第001期
2. 基于一类SVM的不良信息过滤算法改进 [J] . 丁霄云 ,刘功申 ,孟魁 . 计算机科学 . 2013,第0z2期
3. 基于一类SVM概率密度估计的多分类贝叶斯算法研究 [J] . 尹振东 ,吴芝路 ,任广辉 . 重庆邮电大学学报（自然科学版） . 2007,第005期
4. 基于K最近邻算法的网络不良信息过滤系统研究 [J] . 汤烈 ,穆合义 ,候爱莲 . 计算技术与自动化 . 2019,第004期
5. 基于语义分析的网络不良信息过滤系统研究 [J] . 吕滨 ,雷国华 ,于燕飞 . 计算机应用与软件 . 2010,第002期
6. 基于Biased SVMs的中文Web过滤系统 [C] . 杜阿宁 ,方滨兴 . 2005第一届中国分类技术与应用研讨会（CSCA） . 2005
7. 网络不良信息过滤研究 [A] . 林建 . 2007

基于一类SVM的网络不良信息过滤算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅