降维分类方法在入侵检测中的研究与应用

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

本文的目的在于解决高维度数据的实时分类问题。大数据环境下，都会出现有运算效率，大数据量和实时性要求的分类问题，例如，如何从髙维度的网络数据中实时检测出入侵行为；如何从公司大规模的交易业务数据中检测出异常交易行为；如何从电商销售数据中通过对用户的历史行为对用户进行分类等。常用的分类方法有KNN，SVM,贝叶斯分类，决策树等，该类方法分类的准确率及实时性仍有欠缺，尤其是在髙维情况下难以有效处理。本文提出一种基于正交投影的降维分类方法，能够高效地训练分类模型和快速分类。
　　该方法先对数据集进行预处理，剔除噪声数据和缺失值；选择参与分类的属性，构建多分类坐标平面集，通过将各坐标平面进行栅格化，使用二维矩阵进行表示。然后对各属性进行线性映射，将多维数据集投影至栅格中进行统计，用多组二维矩阵记录各类型数据栅格化后的投影频数。训练集数据投影完成后，对各矩阵表示数值型数据的方向进行高斯模糊处理，得到一系列密度矩阵。将待分类数据向密度矩阵进行投影，获得投影点位置的数值，通过比对投影后的矩阵信息，获得其分类信息。若保留模糊前的矩阵，通过将增量的数据集叠加投影到矩阵上，再进行高斯模糊，则能实现增量机制。
　　传统分类方法试图在空间或更高阶的空间中寻找分类面，而本文方法则从数据在各投影面上的分布密度出发，通过综合考虑各概率密度进行分类判断。该方式较完整地保留了数据的边缘密度，因此能较好地还原数据点的空间分布信息。因此能在较小运算量下得到较高的鲁棒性，尤其适用于处理数据量大，维度较高的分类问题。
　　本文运用KDD CUP99网络入侵检测数据进行实验，尝试对19种入侵类型以及一种正常类型进行分类。KDD cup99包含4898429条记录与31维属性，本文挑选其中18个属性进行实验，从所有记录中随机抽取10％作为训练集，其余90%作为测试集。使用150*150的单精度浮点矩阵对每个坐标平面进行栅格化表示，共有20*C218个矩阵。实验结果显示训练模型耗时6193毫秒，分类耗时14133毫秒，总体准确率达到了98.42%,其中5个样本充足的入侵类型识别结果良好，说明了应用本文方法构建入侵检测系统的可行性与高效性。

著录项

作者
卢东略;
展开▼
作者单位

广东工业大学;

展开▼
授予单位广东工业大学;
学科计算机科学与技术
授予学位硕士
导师姓名滕少华;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类电子贸易、网上贸易 ;
关键词
电子商务; 降维分类; 入侵检测; 正交投影; 高斯模糊;

相似文献

中文文献
外文文献
专利

1. 入侵检测系统中的相反性综合降维模型 [J] . 张常有 ,曹元大 ,王玉梅 . 中山大学学报（自然科学版） . 2009 ,第001期
2. 网络入侵检测系统中的特征降维方法 [J] . 范玉涛 ,高立 ,余生晨 . 计算机工程与应用 . 2008 ,第029期
3. 基于互信息降维的SVM算法在网络欺诈行为中的研究与应用 [J] . 张巡 ,彭德芳 . 信息记录材料 . 2017 ,第001期
4. 结合混沌映射与遗传算法的高光谱影像降维分类方法 [J] . 朱腾 ,黄铁兰 ,何军拥 . 北京测绘 . 2021 ,第004期
5. 基于改进WPCA的OSM贡献者特征降维与分类方法 [J] . 韦兴财 ,赵肄江 ,刘毅志 . 地理信息世界 . 2021 ,第6期
6. 用于癌症诊断的基因芯片数据的降维和分类方法 [C] . 姚微佳 ,李通化 ,唐凯临 . 2005中国计算机大会 . 2005
7. 数据降维技术的建模研究与应用——特征降维及其应用 [A] . 申中华 . 2008

降维分类方法在入侵检测中的研究与应用

目录

摘要

著录项

相似文献

相关主题

期刊订阅