首页> 中文学位 >基于AUC和特征间互补性的特征选择方法
【6h】

基于AUC和特征间互补性的特征选择方法

代理获取

目录

声明

第一章 绪论

第一节 研究背景和现状

第二节 研究目的及内容

第三节 本文创新点

第四节 文章组织结构

第二章 相关理论知识概述

第一节 ROC曲线及曲线下面积AUC

第二节 基于AUC的特征选择方法

第三章 基于AUC和特征互补性的特征选择方法

第一节 特征相关性分析

第二节 特征互补性分析

第三节 基于AUC和特征互补性的特征选择方法

第四节 AVC在多类问题上的扩展MAVC

第五节 本章小结

第四章 实验结果及分析

第一节 实验数据说明

第二节 实验设计

第三节 实验结果与分析

第四节 本章小结

第五章 总结及展望

第一节 本文工作总结

第二节 未来工作展望

参考文献

致谢

个人简历

展开▼

摘要

高通量测序技术的发展使得研究人员可以测量几乎所有的人类基因的表达水平。通常,基因数据的样本数量很小,远小于数据包含的基因的数量。在高维的基因数据中,仅有部分基因有助于识别目标疾病。为了选出这些具有识别能力的基因,特征选择是一种有效的方法。
  受试者工作特性(ROC)曲线作为一种评价分类性能的评价标准,在生物医学领域有着广泛的应用。由于在处理类别不平衡和代价敏感的数据时具有显著的优势,在辨别与疾病相关的基因(特征)时,经常使用ROC曲线这种稳健的评价标准。现有的一些基于ROC曲线的特征选择方法能够简单而有效的对单个特征进行评价。然而,这些方法可能无法找到真正的目标特征子集,因为它们缺乏有效的手段来减少特征之间的冗余性。消除特征之间的冗余性在机器学习中是必不可少的。特征的互补性分析正是一种消除特征之间冗余性的有效的方法。
  本文首先分析了ROC曲线相关背景知识以及研究意义,并介绍了一些现有的基于ROC曲线的特征选择方法在生物信息学领域中的应用。之后分析这些特征选择方法在分析处理基因数据上所存在的不足。最后,提出一种新的基于ROC曲线下面积(AUC)及特征互补性分析的特征选择方法。
  本文提出了一种新的特征之间互补性的度量方法,即在不同的二维特征空间上,利用错分类实例与其异类最近邻之间的平均曼哈顿距离作为判定特征之间的互补性的标准。如果在某一特征维度上,每一个错分类实例与距它最近的异类实例,在另一特征维度上都具有更大的距离,那么这两个特征就被视为互补特征。随后,本文提出了一种新的基于ROC分析的过滤式特征选择方法。该方法采用一种启发式搜索策略选出具有最大互补性的最优特征。在一组微阵列基因数据集上的实验结果表明,使用我们所提出的方法选出的特征子集能够使分类器的平衡错误率达到最低,并且选出的特征子集所包含的特征数量最少。由此我们得出结论,与其他基于ROC的特征选择方法相比,我们的方法能够选出更少的关键特征,并且有效的提高分类器的分类性能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号