首页> 中文学位 >超高维生存数据的变量筛选和异常值点识别的研究
【6h】

超高维生存数据的变量筛选和异常值点识别的研究

代理获取

目录

声明

摘要

第一章引言与知识回顾

1.1研究背景介绍

1.2 生存分析概述

1.2.1生存分析的基本概念

1.2.2 生存分析的数据类型

1.2.3生存分析的基本函数

1.2.4 Cox比例风险模型

1.2.5 Kaplan-Meier估计

1.3高维数据分析

1.3.1高维数据简介

1.3.2 惩罚似然方法介绍

1.3.3 常见的惩罚函数介绍

1.3.4调节参数选择

1.4超高维数据分析

1.4.1 完全数据的变量筛选法

1.4.2 删失数据的变量筛选法

1.5.1背景知识介绍

1.5.2 异常值点检测方法

1.5.3线性回归模型中异常值点检测

1.6 本文结构

第二章超高维生存数据中基于删失累积残差的独立筛选法

2.1 引言

2.2 删失累积残差独立筛选法

2.3 理论性质

2.4 数值模拟

2.4.1 基于Cox比例风险模型的模拟研究

2.4.2 基于非线性模型的模拟研究

2.4.3 关于模型大小[n/logn]的模拟研究

2.4.4 关于迭代变量筛选法ICCRIS的模拟研究

2.5 实例分析

2.6 本章小结

2.7本章表格和定理证明

2.7.1定理2.1的证明

2.7.2定理2.2的证明

第三章超高维生存数据中基于相关性排序的独立筛选法

3.1 引言

3.2 基于相关性秩排序的独立筛选法

3.3 理论性质

3.4 数值模拟

3.4.1 基于线性回归模型的模拟研究

3.4.2基于Cox比例风险模型的模拟研究

3.4.3 基于非线性模型的模拟研究

3.4.4 基于转换模型的模拟研究

3.5 实例分析

3.6 本章小结

3.7 本章表格和定理证明

3.7.1定理3.1的证明

3.7.2定理3.2的证明

第四章处理超高维生存数据的非参数变量筛选法

4.1 引言

4.2 基于融合的Kolmogorov-Smirnov统计量的独立筛选法

4.2.1 Kolmogorov-Smirnov检验

4.2.2 基于Kolmogorov-Smirnov统计量的独立筛选法

4.3 理论性质

4.4 数值模拟

4.4.1 基于Cox比例风险模型的模拟研究

4.4.2 基于非线性模型的模拟研究

4.4.3基于转换模型的模拟研究

4.5 实例分析

4.6 本章小结

4.7 本章表格和定理证明

第五章指数回归模型中删失数据的异常值点识别

5.1 引言

5.2 异常值点检测和参数估计

5.3 数值模拟

5.4 实例分析

5.5 本章小结

第六章总结和展望

6.1 总结

6.2 展望

参考文献

致谢

展开▼

摘要

本文讨论了两个问题:超高维生存数据的变量筛选和指数回归模型中生存数据的异常值点识别. 在超高维数据中,确定独立筛选法能以很高概率在保留所有重要变量的前提下快速有效地降低数据的维数.现有的变量筛选方法大多数是针对完全数据提出的,无法处理存在删失的生存数据.本文提出了三种不依赖于模型的变量筛选法来处理超高维生存数据,它们分别是基于删失累积残差、相关性秩排序和Kolmogorov-Smirnov检验统计量.这三种方法在比较弱的正则化条件下拥有确定筛选性(sure screening property)和秩相合性(ranking consistency).模拟实验结果说明这三种方法的表现优于已有的方法.最后我们把它们应用到套细胞淋巴瘤的实例分析中. 现实生活中的大部分数据集会存在异常值点,异常值点的存在会对参数估计、统计推断和模型选择带来不利影响.目前对完全观测数据中异常值点的研究已经硕果累累,却很少有人研究带删失的生存数据中的异常值点识别.本文提出惩罚似然的方法来检测指数回归模型中的异常值点,它可以处理带有删失的生存数据.我们把异常值点识别问题转换成高维正则化回归中的参数估计问题,并采用坐标下降法来提高计算效率.此方法的特点是在检测异常值点的同时可以得到回归系数的估计.数值模拟实验和实例分析的结果显示此方法在处理指数回归模型中的异常值点识别和参数估计时非常有效.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号