声明
致谢
摘要
1.1 研究背景及意义
1.2 国内外研究现状
1.3 论文研究内容
1.4 论文的组织结构
2 相关技术介绍
2.1 数据包捕获技术
2.1.1 Libpcap技术
2.1.2 BPF技术
2.2 深度包检测技术
2.2.2 DPI技术特点
2.3 文件类型识别相关技术
2.3.1 基于后缀名的文件类型识别
2.3.2 基于特征标识的文件类型识别
2.3.3 基于内容的文件类型识别
2.4 网页分类相关技术
2.4.1 网页内容抽取
2.4.2 中文分词
2.4.3 文本特征提取算法
2.4.4 NB分类算法
2.4.5 KNN分类算法
2.4.6 SVM分类算法
2.5 二维码识别相关技术
2.6 Jemalloc内存管理技术
2.7 本章小结
3 文件分类审计系统的关键技术研究
3.1 中文网页特征提取
3.1.1 卡方统计特征提取算法
3.1.2 基于卡方统计的优化特征提取算法
3.1.3 实验步骤与结果
3.2 基于限定区域的文件标识匹配方法
3.2.1 基于特征标识文件分类流程
3.2.2 文件特征标识描述
3.2.3 基于限定区域的文件标识匹配
3.2.4 实验步骤与结果
3.3 多进程架构的性能优化
3.3.1 基于负载均衡的数据分流
3.3.2 父子心跳问题处理
3.3.3 内存优化
3.4 本章小结
4 移动互联网的文件分类审计系统
4.1 设计目标与设计原则
4.1.1 系统设计目标
4.1.2 系统设计原则
4.2 系统结构
4.2.1 系统部署
4.2.2 系统结构
4.3 模块实现
4.3.1 数据采集模块
4.3.2 协议解析及应用识别模块
4.3.3 数据存储模块
4.4 本章小结
5 系统实现与测试
5.1 系统总体实现
5.2 关键功能实现
5.2.1 实时分析实现
5.2.2 文件类型审计实现
5.2.3 网页分类审计实现
5.3 实验结果与分析
5.3.1 实验环境
5.3.2 功能测试
5.3.3 性能测试
5.4 本章小结
6.1 工作总结
6.2 工作展望
参考文献
作者简历及攻读硕士学位期间取得的研究成果
学位论文数据集