首页> 中文学位 >基于代价敏感的特征选择及其在软件缺陷预测中的应用
【6h】

基于代价敏感的特征选择及其在软件缺陷预测中的应用

代理获取

目录

摘要

Abstract

目录

第1章 绪论

1.1 研究背景及意义

1.2 国内外现状

1.3 主要工作

1.4 论文组织结构

第2章 软件缺陷预测与特征选择简介

2.1 软件缺陷预测简介

2.1.1 软件特征及真实数据集介绍

2.1.2 软件缺陷预测的实际问题

2.1.3 软件缺陷预测的基本框架

2.1.4 软件缺陷预测的评价准则

2.2 特征选择简介

2.2.1 过滤式特征选择

2.2.2 封装式特征选择

2.2.3 特征子集搜索策略

2.2.4 基于支持向量机的特征选择

第3章 基于CSSVM的全局特征选择算法

3.1 引言

3.2 代价敏感的支持向量机CSSVM

3.3 基于CSSVM的全局特征选择算法FS-CSSVM

3.3.1 算法思想

3.3.2 算法描述

3.4 实验

3.4.1 实验设置

3.4.2 实验结果与分析

3.5 本章小结

第4章 基于CSSVM的局部特征子集选择及合成算法

4.1 引言

4.2 互信息

4.3 基于CSSVM的局部特征子集选择及合成算法FSS-CSSVM

4.3.1 算法思想

4.3.2 算法描述

4.4 实验

4.4.1 实验设置

4.4.2 实验结果与分析

4.5 本章小结

第5章 基于代价敏感LapSVM的半监督特征选择算法

5.1 引言

5.2 半监督Laplacian支持向量机LapSVM

5.3 基于代价敏感LapSVM的半监督特征选择算法FS-CSLapSVM

5.3.1 算法思想

5.3.2 算法描述

5.4 实验

5.4.1 实验设置

5.4.2 实验结果与分析

5.5 本章小结

第6章 结束语

6.1 工作总结

6.2 工作展望

参考文献

附录

致谢

展开▼

摘要

随着软件规模和复杂度的加大,软件测试的难度也在不断地加大。软件系统潜在的缺陷如果不及时排除,将导致运行过程中的软件故障,带来不可估量的损失。软件缺陷预测技术能够自动判断软件各模块是否含有缺陷,从而减少测试过程中的人力成本,提高软件开发效率。软件缺陷预测主要面临三个实际问题:(1)类别不平衡:有缺陷的软件模块远少于无缺陷的软件模块。目前,最常用的处理方法是抽样,但其改变了数据的初始分布。(2)软件特征中存在不相关特征和冗余特征。一般都采用特征选择的处理方法。(3)软件测试早期,只有少量的软件模块被测试,即只有少量的样本被贴上标签。研究者们通常采用半监督学习或聚类方法,挖掘无标签样本的信息,提高早期软件缺陷预测能力。
  针对这三个主要问题,论文侧重对不平衡数据的特征选择进行深入研究,主要工作如下:1.提出了基于代价敏感SVM的全局特征选择算法FS-CSSVM。通过给缺陷样本赋予较高的错分代价,无缺陷样本赋予较小的错分代价,采用AUC对每个软件特征的分类能力进行度量,以此得到有效的特征序列。在NASA真实软件数据集上,对该算法的性能进行了验证。2.提出了基于代价敏感SVM的局部特征子集选择及合成算法FSS-CSSVM。该算法以FS-CSSVM为基础,运用互信息计算每一类特征之间的相关性,通过后退子集搜索策略,逐个剔除同一类特征中的冗余特征。NASA数据集上的实验结果验证了算法的有效性。3.提出了基于代价敏感Laplacian SVM的半监督特征选择算法FS-CSLapSVM。该算法以代价敏感的Laplacian SVM为基础,设计出了同时考虑软件数据集的类别不平衡性和无标签样本的结构信息的特征选择算法,并进行了实验验证。

著录项

  • 作者

    陈银娟;

  • 作者单位

    南京师范大学;

  • 授予单位 南京师范大学;
  • 学科 计算机应用技术
  • 授予学位 硕士
  • 导师姓名 杨明;
  • 年度 2012
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.53;
  • 关键词

    软件开发; 缺陷预测; 代价敏感; 特征选择;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号