首页> 中国专利> 基于抽象语法树的程序代码相似性快速比较方法

基于抽象语法树的程序代码相似性快速比较方法

摘要

本发明涉及一种基于抽象语法树的程序代码相似性快速比较方法,涉及代码复用技术领域。本发明的基于抽象语法树的程序代码相似性快速比较方法,该方法通过构造程序抽象语法树,然后基于抽象语法树提取程序代码特征,并将代码特征哈希化,最后通过计算代码特征哈希值的汉明距离进行代码相似性的判定。该方法以程序代码抽象语法树为比较对象,同时结合Simhash与倒排索引技术,将程序代码的相似性比较转化成代码特征哈希值的比较。在保证高准确率和召回率的前提下,这种方法不仅能够实现程序代码的快速相似性比较,而且还能够满足针对海量代码进行快速相似性比较的需要。该方法具有较好的时间和空间复杂度,能够适应针对海量代码的相似性比较应用场景,从而为软件代码复用及溯源提供支持手段。

著录项

  • 公开/公告号CN109445834B

    专利类型发明专利

  • 公开/公告日2021-04-30

    原文格式PDF

  • 申请/专利权人 北京计算机技术及应用研究所;

    申请/专利号CN201811273830.6

  • 申请日2018-10-30

  • 分类号G06F8/70(20180101);

  • 代理机构11011 中国兵器工业集团公司专利中心;

  • 代理人王雪芬

  • 地址 100854 北京市海淀区永定路51号

  • 入库时间 2022-08-23 11:43:09

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号