首页> 中国专利> 一种软件代码中重复片段的检测提取方法

一种软件代码中重复片段的检测提取方法

摘要

本发明提供了一种软件代码中重复片段的检测提取方法,该方法包括如图的步骤一到步骤八,由于代码片段提取采取的语法树中的分层的信息,考虑了代码片段中的语法信息,使得提取的代码片段是有意义的。此外,代码片段的提取过程受到基于倒排索引的查重机制控制:如果已经发现高层次的重复了,低层次就不提取了。这种提取方法相较目前的大多数技术中先分到最小的片段检查重复然后再进行组合的方式,可以节约很多计算量。过程中,检测窗口大小能够根据实际是否存在重复的上下文进行自动调节,提高性能,检测速度快,可以被应用于实时检测场景。同时因为该方法结合了语法结构信息,因此误判率非常低。

著录项

  • 公开/公告号CN106294139B

    专利类型发明专利

  • 公开/公告日2018-08-31

    原文格式PDF

  • 申请/专利权人 上海理工大学;

    申请/专利号CN201610625476.3

  • 发明设计人 张刚;

    申请日2016-08-02

  • 分类号

  • 代理机构上海德昭知识产权代理有限公司;

  • 代理人郁旦蓉

  • 地址 200093 上海市杨浦区军工路516号

  • 入库时间 2022-08-23 10:16:20

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-08-31

    授权

    授权

  • 2017-02-01

    实质审查的生效 IPC(主分类):G06F11/36 申请日:20160802

    实质审查的生效

  • 2017-02-01

    实质审查的生效 IPC(主分类):G06F 11/36 申请日:20160802

    实质审查的生效

  • 2017-01-04

    公开

    公开

  • 2017-01-04

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号