首页> 中文学位 >基于线性混合模型对大型数据的统计分析方法及其应用
【6h】

基于线性混合模型对大型数据的统计分析方法及其应用

代理获取

目录

声明

摘要

第1章 绪论

1.1 线性混合模型在大型数据上的应用以及研究现状

1.2 大型蛋白质质谱数据处理研究概况

1.2.1 大型蛋白质质谱数据的研究意义

1.2.2 蛋白质谱数据预处理阶段的研究

1.3 针对大型矩阵的奇异值分解的研究现状

1.4 本文的研究内容

第2章 相关理论概述

2.1 极大似然估计与受限的极大似然估计

2.2 奇异值分解理论概述

2.3 EMMA方法与FaST方法概述

第3章 针对大型矩阵奇异值分解的求解方法

3.1 面向列的分块R-SVD方法

3.2 并行计算与面向列的分块R-SVD方法结合

3.3 面向行的分块SVD方法

3.4 针对大型分块对角稀疏矩阵的特殊方法

第四章 数据模拟结果

4.1 面向列分块R-SVD方法的模拟结果

4.1.1 设计矩阵Z的维数为100,000乘4000时

4.1.2 设计矩阵Z的行数为500,000和1000,000时

4.2 面向行分块SVD方法的模拟结果

4.3 黑色素瘤细胞质谱数据分析

结论与展望

致谢

参考文献

附录1

附录2

攻读硕士学位期间发表的论文及科研成果

展开▼

摘要

线性混合模型已经成为一类重要的统计模型,近年来,线性混合模型在各个领域得到了越来越广泛的应用。并且线性混合模型已被应用到多种多样的数据类型上。随着信息时代的发展,以数据为中心的传统科学的研究,例如基因组学、蛋白组学、脑科学等,产生了越来越多的大数据,线性混合模型也被越来越多的统计学家应用到了这种大型的基因数据与蛋白质质谱数据上。
   本文为了解决在普通配置的计算机上,对于具有大型瘦长型设计矩阵的线性混合模型的参数估计问题。在FaST-LMM方法的思想基础上,通过推广用来求解dominant奇异子空间的方法,结合核外计算的思想得到了两种新的方法来求大型瘦长型矩阵的奇异值分解,即面向列分块的R-SVD方法,面向行分块SVD方法,并给出了这两种方法的并行算法的实现方法。将它们与FaST-LMM方法结合就可以在普通计算机上求得大数据线性混合模型的参数估计,本文在R中分别对这两种方法给出了模拟。
   为了能够将FaST-LMM方法应用到黑色素瘤质谱数据的分析上,本文还介绍了针对大型分块对角稀疏矩阵的SVD计算方法,并在R中实现了数据分析的过程。
   通过论文的研究工作,得出了一些有价值的规律和结论。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号