首页> 中文学位 >关于独立性检验的距离秩和距离相关系数在高维独立性检验和特征筛选下的比较
【6h】

关于独立性检验的距离秩和距离相关系数在高维独立性检验和特征筛选下的比较

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 引言

第一节 研究背景及现状

第二节 本文主要工作

第二章 HHG统计量和DC统计量的定义及性质

第一节 列联表检验

第二节 HHG统计量

第三节 基于似然比的HHG统计量

第四节 Distance Correlation

第三章 高维下的独立性检验

第一节 HHG统计量和DC统计量在高维下的比较

第二节 高维数据下统计量的改进

第四章 超高维数据的特征筛选

第一节 基于HHG统计量的特征筛选算法

第二节 HHG-SIS与DC-SIS的蒙特卡洛模拟比较

第三节 迭代的HHG-SIS算法

第四节 HHG统计量和DC统计量的计算量的比较

第五章 结论

参考文献

致谢

个人简历

展开▼

摘要

高维数据在生物医学,基因学,图像学,语音学等方面被广泛应用,其中独立性检验H0:PX Y=PX PY和超高维特征筛选是很重要的两个问题,比如在基因生物学中判定两种基因是否有相关性,与疾病相关的多个基因的变量筛选等等。
  本文主要考虑HHG统计量在高维下的独立性检验和在超高维下的特征筛选算法。在变量维数 p随样本量n同阶或高阶趋于无穷时,在多种模型下对HHG统计量和DC统计量的独立性检验结果做了比较,在正态分布独立性假设下,两种统计量均能很好控制第一类错误概率,在非线性假设下,HHG统计量和DC统计量的势基本都均随样本量的增长,维数下降,而增大,其中HHG统计量在高阶多项式模型下表现较好。在高维情况下,当变量维数p远远大于样本量n(p>>n),甚至p=O(eαn)时,提出了基于HHG统计量的特征筛选算法HHG-SIS,并进一步用蒙特卡洛模拟将其与DC-SIS做了比较,并且HHG统计量在异方差模型,有变量相乘或示性函数等非线性相关性时的表现要优于DC统计量。同时类似于SIS的迭代算法ISIS,为提高特征筛选准确度,提出了迭代的HHG-SIS算法。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号