首页> 中文期刊> 《电子设计工程》 >基于XGBoost算法结合域名信息筛选的流量识别方法

基于XGBoost算法结合域名信息筛选的流量识别方法

             

摘要

传统的流量识别方法主要有基于流量行为特征的指纹信息匹配技术、深层数据包检测技术、基于端口映射的流量识别技术等.基于机器学习的识别技术是目前较为先进的一种,它利用机器学习自学习、自组织和自适应的特性,可有效解决传统流量识别方法存在实现复杂、速率慢等问题,但是由于网络环境当中存在大量的背景流量,导致机器学习的精确率较低.本文针对传统的流量识别技术和单纯机器学习方法的缺陷,提出了一种使用XGBoost机器学习模型与域名信息结合的方式进行流量识别的技术,首先分别对HTTP协议数据和HTTPS协议数据构建机器学习模型进行流量的初步识别,然后构建应用与其二级域名的映射关系.对于模型识别为正类的数据提取域名信息(HTTP提取host字段、HTTPS提取SNI域),最后根据应用与二级域名的映射关系对模型识别的结果进行二次筛选,进一步提高准确率.

著录项

  • 来源
    《电子设计工程》 |2019年第6期|177-182187|共7页
  • 作者

    张先勇; 汤鲲;

  • 作者单位

    南京烽火天地通信科技有限公司 江苏南京 210019;

    武汉邮电科学研究院 湖北武汉430074;

    武汉邮电科学研究院 湖北武汉430074;

    南京烽火星空通信发展有限公司 江苏南京210000;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 理论;
  • 关键词

    XGBoost; 域名筛选; 流量识别; HTTP; HTTPS;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号