基于多任务学习模型的癌症基因生存分析研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

生存分析是当今热门的统计学分支，它是分析生存现象和响应时间数据及其规律的一类统计分析方法。生存分析的研究通常是针对所研究的事物建立相应的模型，通过数据特征进行生存时间预测并进行系统的分析，在医学、生物制药、商业与工业等均有广泛的应用。　　然而在收集临床病例数据时，往往受到删失数据的影响导致许多算法无法使用。而使用如Cox比例风险模型或参数回归模型等模型需要对数据进行一些严格的假设，这种做法破坏了事物原有性质，对实际问题的研究是非常不合适的。为了解决上述两种限制条件，本文使用了一种基于多任务学习模型的癌症基因生存分析方法。此算法是一种归纳迁移学习方法，它可以共享相关任务之间的表征，充分获取删失数据特征中的信息，利用隐含在各特征间的特定领域信息来提高模型的泛化能力，能够更好地概括原始任务，解决了其他生存分析算法无法使用删失数据进行训练的问题。同时，在使用多任务学习时不需要对原问题进行任何额外的假设，针对完整的问题进行建模，大大增加了预测精度。　　本文的研究重点主要放在如何将生存分析的预测工作转化成使用多任务学习算法来分析建模，提高生存分析的预测性能。研究工作分为以下几个部分：　　（1）基础技术研究与相关算法考察。本文详细分析了领域内相关算法对删失数据的处理，通过算法分析、搭建模型、实验与分析等步骤系统地分析了不同算法间处理删失数据的差异，为文本的模型的搭建提供了理论依据。　　（2）基础模型与优化算法选择。本文一个很重要的研究目的是如何充分使用删失数据中的信息来提高模型的预测准确度。使用多任务学习模型作为基础模型能够共享相关任务间的表征，利用隐含的特定领域信息来提高模型的泛化能力。同时还引入了矩阵范数惩罚项与交替方向乘子算法，用于解决模型的过拟合问题。　　（3）模型的搭建与改进。本文将生存分析中生存时间预测问题转化为经典的二分类回归问题，使用了新的目标函数来解决转化后的回归问题。而解决凸优化问题时引入的交替方向乘子算法进行优化求解。最后对模型的收敛性与时间复杂度进行分析与总结。　　（4）实验结果分析。本文使用的数据集为几个主流的高维癌症基因表达生存数据集，使用了本文算法与几种常见的生存分析算法进行了实验，并使用C-index值和AUC值作为评价指标，实验最后还对模型的可扩展性进行了验证。

著录项

作者
李智勇;
展开▼
作者单位

华南农业大学;

展开▼
授予单位华南农业大学;
学科计算机技术
授予学位硕士
导师姓名刘财兴;
年度 2018
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词
癌症基因,多任务学习,生存分析,C-index值,AUC值;

相似文献

中文文献
外文文献
专利

1. 基于多任务学习模型的药物敏感性预测 [J] . 唐益翔 . 软件导刊 . 2020,第001期
2. 基于多任务学习模型的中药饮片识别 [J] . 王永康 ,胡继礼 ,阚红星 . 现代中药研究与实践 . 2020,第002期
3. 晚期癌症患者中医辨证分型分布及其同生存期的相关性分析研究 [J] . 顾筱莉 ,成文武 ,陈萌蕾 . 中国癌症杂志 . 2018,第007期
4. 基于三种机器学习模型的土力学课程目标达成情况分析研究 [J] . 陈志雄 ,仉文岗 ,丁选明 . 高等建筑教育 . 2021,第006期
5. 基于癌症基因组图谱计划多组学数据构建胶质母细胞瘤六基因预后模型 [J] . 雷常贵 ,贾学渊 ,孙文靖 . 遗传 . 2021,第007期
6. 基于基因芯片表达谱的癌症预后元分析研究 [C] . 杨锡南 ,孙啸 . 2006年中国科学院智能计算与生物信息学学术研讨会 . 2006
7. 基于模型融合的法律判决预测多任务学习模型 [A] . 毛爱华 . 2020

基于多任务学习模型的癌症基因生存分析研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅