基于代码属性图及注意力双向LSTM的漏洞挖掘方法

段旭; 吴敬征; 罗天悦; 杨牧天; 武延军

首页> 中文期刊> 《软件学报》 >基于代码属性图及注意力双向LSTM的漏洞挖掘方法

基于代码属性图及注意力双向LSTM的漏洞挖掘方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

随着信息安全愈发严峻的趋势,软件漏洞已成为计算机安全的主要威胁之一.如何准确地挖掘程序中存在的漏洞,是信息安全领域的关键问题.然而,现有的静态漏洞挖掘方法在挖掘漏洞特征不明显的漏洞时准确率明显下降.一方面,基于规则的方法通过在目标源程序中匹配专家预先定义的漏洞模式挖掘漏洞,其预定义的漏洞模式较为刻板单一,无法覆盖到细节特征,导致其存在准确率低、误报率高等问题;另一方面,基于学习的方法无法充分地对程序源代码的特征信息进行建模,并且无法有效地捕捉关键特征信息,导致其在面对漏洞特征不明显的漏洞时,无法准确地进行挖掘.针对上述问题,提出了一种基于代码属性图及注意力双向LSTM的源码级漏洞挖掘方法.该方法首先将程序源代码转换为包含语义特征信息的代码属性图,并对其进行切片以剔除与敏感操作无关的冗余信息;其次,使用编码算法将代码属性图编码为特征张量;然后,利用大规模特征数据集训练基于双向LSTM和注意力机制的神经网络;最后,使用训练完毕的神经网络实现对目标程序中的漏洞进行挖掘.实验结果显示,在SARD缓冲区错误数据集、SARD资源管理错误数据集及它们两个C语言程序构成的子集上,该方法的F1分数分别达到了82.8％,77.4％,82.5％和78.0％,与基于规则的静态挖掘工具Flawfinder和RATS以及基于学习的程序分析模型TBCNN相比,有显著的提高.

著录项

来源
《软件学报》 |2020年第11期|3404-3420|共17页
作者
段旭; 吴敬征; 罗天悦; 杨牧天; 武延军;
展开▼
作者单位

智能软件研究中心(中国科学院软件研究所) 北京100190;

中国科学院大学北京 100049;

智能软件研究中心(中国科学院软件研究所) 北京100190;

计算机科学国家重点实验室(中国科学院软件研究所) 北京 100190;

智能软件研究中心(中国科学院软件研究所) 北京100190;

智能软件研究中心(中国科学院软件研究所) 北京100190;

智能软件研究中心(中国科学院软件研究所) 北京100190;

计算机科学国家重点实验室(中国科学院软件研究所) 北京 100190;

展开▼
原文格式 PDF
正文语种 chi
中图分类程序设计、软件工程;
关键词
漏洞挖掘; 深度学习; 静态分析; 注意力机制; 代码属性图;

相似文献

中文文献
外文文献
专利

1. 基于属性图匹配的漏洞代码检测技术 [J] . 童瀛 ,周宇 ,李勇男 . 中国人民公安大学学报（自然科学版） . 2021,第003期
2. 一种基于代码注入的反漏洞挖掘方法 [J] . 武泽慧 ,丁文博 ,袁会杰 . 信息工程大学学报 . 2020,第006期
3. 基于Bi-LSTM和自注意力的恶意代码检测方法 [J] . 唐永旺 ,刘欣 . 计算机应用与软件 . 2021,第003期
4. 基于双向LSTM和注意力机制的DNA N4-甲基胞嘧啶修饰位点识别 [J] . 崔鼎 . 软件 . 2021,第004期
5. 基于注意力机制与双向LSTM的行为识别 [J] . 张玉铭 ,吴克伟 ,金依珂 . 计算机科学与应用 . 2021,第006期
6. 一种基于动态污点分析的恶意代码行为依赖图挖掘方法 [C] . YOU Zuosai ,尤作赛 ,WANG Yongjun . 中国教育和科研计算机网CERNET第十九届学术年会 . 2012
7. 基于代码属性图和图卷积神经网络的软件漏洞检测方法研究 [A] . 段亚男 . 2020

基于代码属性图及注意力双向LSTM的漏洞挖掘方法

摘要

著录项

相似文献

相关主题

期刊订阅