基于学习排序的软件缺陷定位技术研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

软件缺陷bug的发现和修复是软件工程的核心任务之一。为提高管理质量，软件缺陷跟踪系统得到了广泛应用，通过缺陷报告、分派任务和缺陷定位等流程进行bug修复，但人工完成这些工作需要大量的人力和时间。纵观软件缺陷定位问题的研究现状，准确率方面尚有不少提升空间，并且测试数据集主要集中在Java项目。本文的研究聚焦于应用信息检索和学习排序技术实现软件缺陷定位自动化。
　　本文所提出方案首先采用自然语言处理技术进行文本预处理，并基于信息检索模型进行相似度计算，最终采用机器学习方法进行结果推荐。对于测试数据集，本文构建了Apache Spark项目的数据集，以1.6.0和1.6.1版本bug报告作为查询集，1.5.2版本源代码作为文档集，并经过人工核对得到报告-文件的对应关系以用于实验结果的检验；相似度指标方面，不同于传统的单纯计算文本相似度的方法，本文提出从文本、标识符和组件三个维度衡量相似度，最终结合三者综合判定bug报告与文件的相关程度；结果推荐方面，不同于传统的线性加权方案，本文提出应用排序支持向量机算法Ranking SVM将三个维度得分综合排序，通过机器学习中的学习排序技术得到文件相关度排名。
　　本文应用以上方案实现了一个软件缺陷定位原型系统RSLocator（Ranking SVM Locator），并在Spark测试数据集上进行了实验验证。新构建的Spark数据集包含多种程序语言，可以对现有的常用数据集起到有益补充。本文选取准确率、召回率和平均倒数排名等多个指标将方案与经典的VSM模型和BM25模型进行对比。结果表明，结合文本、标识符和组件三个维度方案的结果比仅计算文本相似度的经典算法有较为明显的提高，结果推荐方面，使用Ranking SVM算法相比传统的线性加权方案也有更好表现。

著录项

作者
张哲峰;
展开▼
作者单位

南京邮电大学;

展开▼
授予单位南京邮电大学;
学科软件工程
授予学位硕士
导师姓名肖甫;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.52;
关键词
软件缺陷定位; 学习排序; 信息检索; 支持向量机; 文本相似度;

相似文献

中文文献
外文文献
专利

1. 基于信息检索的软件缺陷定位技术研究进展 [J] . 张芸 ,刘佳琨 ,夏鑫 . 软件学报 . 2020,第008期
2. 基于信息流的关键软件缺陷定位技术 [J] . 周东红 ,石柱 ,王瑞 . 载人航天 . 2016,第005期
3. 基于软件自动修复评估缺陷定位技术的工具:GenProg-FL [J] . 纪涛 ,齐玉华 ,毛晓光 . 计算机科学 . 2014,第009期
4. 基于排序学习的软件众包任务推荐算法 [J] . 余敦辉 ,成涛 ,袁旭 . 计算机科学 . 2020,第012期
5. 基于排序学习的Top-k软件服务推荐方法 [J] . 肖海涛 ,何鹏 ,曾诚 . 计算机应用 . 2018,第0z1期
6. 基于上下文的飞控软件老化缺陷定位方法研究 [C] . DU Xiaoting ,杜晓婷 ,WANG Nan . 第15届全国软件与应用学术会议（NASAC2016） . 2016
7. 基于超声导波技术的管道缺陷定位方法研究及软件实现 [A] . 武颖 . 2010

基于学习排序的软件缺陷定位技术研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅