首页> 中文学位 >基于模式匹配和机器学习的协议识别技术研究
【6h】

基于模式匹配和机器学习的协议识别技术研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

图目录

表目录

第一章 绪 论

1.1课题研究背景及意义

1.2国内外研究现状

1.3研究内容及组织结构

第二章 协议识别技术研究

2.1协议识别的概念

2.2三种常见的协议识别技术

2.3一种基于模式匹配和机器学习的协议识别系统框架

2.4本章小结

第三章 基于模式匹配的协议识别技术研究

3.1模式匹配算法概述

3.2经典的模式匹配算法

3.3一种改进的BM算法

3.4本章小结

第四章 基于机器学习的协议识别技术研究

4.1机器学习概述

4.2基于机器学习的协议识别技术研究

4.3基于ESBS-GA方法的流量特征选择

4.4一种基于二分查找法的K值优化方案

4.5本章小结

第五章 总结和展望

5.1全文总结

5.2技术展望

致谢

参考文献

攻硕期间取得的研究成果

展开▼

摘要

协议识别技术是实现流量监控、入侵检测以及用户行为分析等应用的基础。随着互联网的发展,新型的网络类型不断出现,新的协议规范很多都不再对外公开且使用随机的端口。另外,由于信息安全或用户隐私的问题,有越来越多的网络流量被加密,这些都使得协议识别面临和需要解决的问题越来越复杂。所以,寻找更加高效的协议识别方法有着重要的研究和实际应用意义。基于内容的协议识别能够达到很高的准确率,基于流统计特征的识别可以识别加密流量且有较好的吞吐性,这两种协议识别方法是当今协议识别中应用最广泛的。
  本文主要是通过改进这两种协议识别方法中的匹配算法的性能来提高协议识别效率的,具体的研究工作主要包括以下几个方面:
  1)提出基于模式匹配和机器学习的协议识别系统。该系统结合这两种协议识别技术的优点,可以通过模式匹配方法实现对协议内容的高准确率的识别,也可以利用机器学习方法识别出加密的流量,并可以对协议特征库不断更新。
  2)研究和分析了常见的模式匹配算法,并提出了一种改进的BM算法。该算法可以减少算法预处理复杂度,并充分利用失配时候的信息,提高最大跳跃距离,并考虑了更多情况,提高模式串达到最大或者较大跳跃距离的概率,从而提高了匹配的效率。
  3)提出了一种ESBS-GA特征选择方法。在现有的特征选择方法的基础之上,用遗传算法对现在常用的一些流量特征进一步筛选。ESBS-GA能够筛选获得特征个数更少,且分类效果更佳的流量特征集合,简化了 Kmens分类过程,大大提高了分类性能。
  4)研究和分析了常见的机器学习算法,针对K-means算法中K值较难确定的缺点,提出一种基于二分查找法的K值优化方案。通过结合二分查找法,能够更迅速的确定出比较接近实际分类个数的K值,并且在该K值下,能够获得很好分类效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号