基于机器学习的网络业务流量识别技术研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着互联网用户群体急剧增长，网络规模迅速膨胀，网络业务类型也变得愈加复杂。为了提供安全、可靠的网络环境，对网络进行高效管理刻不容缓。作为网络管理的核心技术，网络流量识别能够为网络行为分析、带宽资源分配、网络运营管理和网络架构改进提供有力的数据支撑。然而，传统的基于端口号、基于深度包检测和基于行为特性的流量识别方法已经不能满足当前网络流量识别的需要。近年来，人工智能发展迅速，机器学习不断成熟，已广泛应用于各个领域。利用机器学习算法进行网络流量识别，既能保证识别的准确性，又能保证系统的鲁棒性。因此，开展基于机器学习的网络业务流量识别技术研究具有重要的学术价值和应用前景。　　由于网络流量数据规模庞大、特征属性众多，为了提高流量识别效率，需要进行特征选择以约简特征集合，同时业务流量的类不平衡现象也为流量识别带来了极大的挑战。论文提出了一种基于加权对称不确定性的多阶段特征选择算法，该算法分多阶段筛选特征，首先基于加权对称不确定性计算类别权重平衡多数类与少数类，缓解类不平衡现象并剔除不相关特征；然后基于皮尔逊相关系数判断特征之间的相关程度，筛选掉冗余特征；最后采用禁忌搜索策略寻找最优特征子集。理论与仿真实验表明，该算法实现了网络流量的快速降维，与近年来提出的基于机器学习进行特征选择的算法相比，在特征维度、分类速度和识别精度等方面都表现出较大优势。　　尽管特征选择有效降低了特征维度，简化了机器学习任务，但使用单分类器进行网络流量识别的稳定性稍显不足。而且，网络流量随着时间推移常常产生概念漂移现象，这对流量识别而言是个极大的考验。为了减弱概念漂移对系统识别性能的影响，论文提出了一种多分类器集成学习算法。该算法基于Bagging集成学习框架，将数据流划分为连续子块，引入自适应窗口机制检测网络流量中的概念漂移，动态调整融合分类器中各基分类器的权重，采用增量学习的策略更新系统模型，组合优化分类结果输出最终预测的应用类别。论文通过实验确定了网络流量数据块的最佳规模和基分类器的最佳数量，理论与仿真实验表明，与单分类器算法和传统的Baggi ng算法相比，该算法可有效应对概念漂移，提高流量识别的准确性和稳定性。

著录项

作者
孙志成;
展开▼
作者单位

重庆大学;

展开▼
授予单位重庆大学;
学科工程(电子与通信工程)
授予学位硕士
导师姓名江禹生;
年度 2019
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词
流量识别,机器学习,类不平衡,特征选择,概念漂移,集成学习;

相似文献

中文文献
外文文献
专利

1. 基于多层级联算法的网络业务流量识别技术 [J] . 黄凤 ,王瑶 ,黄莉 . 电信科学 . 2015,第S1期
2. 基于机器学习的隐蔽隧道恶意加密流量检测识别研究 [J] . 张诚 ,叶红 ,吕博良 . 中国金融电脑 . 2021,第010期
3. 基于机器学习的网络流量识别方法研究 [J] . 孙裕康 . 信息与电脑 . 2020,第023期
4. 基于DPI和机器学习的加密流量类型识别研究 [J] . 陈荣平 . 数字通信世界 . 2019,第004期
5. 一种基于机器学习的P2P网络流量识别算法研究∗ [J] . 袁华兵 . 计算机与数字工程 . 2019,第010期
6. 一种基于机器学习的P2P网络流量识别方法 [C] . 李致远 ,王汝传 . 第十七届全国网络与数据通信学术会议(NDCC2010) . 2010
7. 基于DPI的网络业务流量识别技术研究 [A] . 刘泷 . 2017

基于机器学习的网络业务流量识别技术研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅