基于代价敏感的特征选择及其在软件缺陷预测中的应用

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着软件规模和复杂度的加大,软件测试的难度也在不断地加大。软件系统潜在的缺陷如果不及时排除,将导致运行过程中的软件故障,带来不可估量的损失。软件缺陷预测技术能够自动判断软件各模块是否含有缺陷,从而减少测试过程中的人力成本,提高软件开发效率。软件缺陷预测主要面临三个实际问题:(1)类别不平衡:有缺陷的软件模块远少于无缺陷的软件模块。目前,最常用的处理方法是抽样,但其改变了数据的初始分布。(2)软件特征中存在不相关特征和冗余特征。一般都采用特征选择的处理方法。(3)软件测试早期,只有少量的软件模块被测试,即只有少量的样本被贴上标签。研究者们通常采用半监督学习或聚类方法,挖掘无标签样本的信息,提高早期软件缺陷预测能力。
　　针对这三个主要问题,论文侧重对不平衡数据的特征选择进行深入研究,主要工作如下:1.提出了基于代价敏感SVM的全局特征选择算法FS-CSSVM。通过给缺陷样本赋予较高的错分代价,无缺陷样本赋予较小的错分代价,采用AUC对每个软件特征的分类能力进行度量,以此得到有效的特征序列。在NASA真实软件数据集上,对该算法的性能进行了验证。2.提出了基于代价敏感SVM的局部特征子集选择及合成算法FSS-CSSVM。该算法以FS-CSSVM为基础,运用互信息计算每一类特征之间的相关性,通过后退子集搜索策略,逐个剔除同一类特征中的冗余特征。NASA数据集上的实验结果验证了算法的有效性。3.提出了基于代价敏感Laplacian SVM的半监督特征选择算法FS-CSLapSVM。该算法以代价敏感的Laplacian SVM为基础,设计出了同时考虑软件数据集的类别不平衡性和无标签样本的结构信息的特征选择算法,并进行了实验验证。

著录项

作者
陈银娟;
展开▼
作者单位

南京师范大学;

展开▼
授予单位南京师范大学;
学科计算机应用技术
授予学位硕士
导师姓名杨明;
年度 2012
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.53;
关键词
软件开发; 缺陷预测; 代价敏感; 特征选择;

相似文献

中文文献
外文文献
专利

1. 软件缺陷预测中基于Wrapper的特征选择方法 [J] . 常瑞花 ,沈晓卫 . 火力与指挥控制 . 2017,第010期
2. 基于代价敏感半监督的跨项目软件缺陷数预测模型 [J] . 高晶 . 沈阳工程学院学报:自然科学版 . 2022,第1期
3. 基于代价敏感主动学习的软件缺陷预测方法 [J] . 曲豫宾 ,陈翔 . 南通大学学报（自然科学版） . 2019,第001期
4. 基于卷积神经网络的代价敏感软件缺陷预测模型 [J] . 邱少健 ,蔡子仪 ,陆璐 . 计算机科学 . 2019,第011期
5. 基于代价敏感支持向量机的软件缺陷预测研究 [J] . 任胜兵 ,廖湘荡 . 计算机工程与科学 . 2018,第010期
6. 分区代价敏感C4.5模型在电信客户流失预测中的应用 [C] . Wang Chuan-qi ,王传启 ,Huang Hai . 第17届中国系统仿真技术及其应用学术年会（17th CCSSTA 2016) . 2016
7. 代价敏感特征选择算法及其在软件缺陷预测中的应用 [A] . 缪林松 . 2012

基于代价敏感的特征选择及其在软件缺陷预测中的应用

目录

摘要

著录项

相似文献

相关主题

期刊订阅