基于多组学数据的乳腺癌预后预测模型构建

苏婕怡

首页> 中文期刊> 《应用数学进展》 >基于多组学数据的乳腺癌预后预测模型构建

基于多组学数据的乳腺癌预后预测模型构建

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

本文主要从UCSC Xena数据库中已经整理好的关于TCGA数据库的乳腺癌数据中,挑选了拷贝数变异、RNA基因表达量、RNA外显子表达量三个组学方面的数据。首先,基于三个组学数据的维度远大于样本量的特征,分别对三个组学的数据进行方差阈值过滤,初步筛选过滤掉变化幅度不大的变量,再使用mRMR进行滤波式的变量选择方法,即最大化特征与分类变量之间的相关性,最小化特征之间的相关性,各自筛选得到50个变量。对于离散型的天数表型数据,采用阈值方法将其转化为0-1分类变量,最终将因变量与自变量进行合并,并划分测试集、训练集,使用svm、XGBoost、Logistic、RandomForest四种方法对结果变量进行预后预测,并采用特定的指标对这四种算法进行比较,运用在训练集上,最终得到XGBoost、Logistic两种算法的预测效果要优于svm、RandomForest。

著录项

来源
《应用数学进展》 |2022年第9期|6723-6729|共7页
作者
苏婕怡;
展开▼
作者单位

青岛大学青岛;

展开▼
原文格式 PDF
正文语种 chi
中图分类计算技术、计算机技术;
关键词
多组学; mRMR; XGBoost; SVM; LOGISTIC; RandomForest; 变量选择; 预后预测;

相似文献

中文文献
外文文献
专利

1. 基于多组学高通量数据分析乳腺癌中8号染色体开放阅读框33的表达和预后 [J] . 张虎 ,杜欣娜 ,凌存宝 . 中国老年学杂志 . 2019,第011期
2. 基于癌症基因组图谱计划多组学数据构建胶质母细胞瘤六基因预后模型 [J] . 雷常贵 ,贾学渊 ,孙文靖 . 遗传 . 2021,第007期
3. 基于高通量多组学数据分析ESYT3在乳腺癌中的表达及临床意义 [J] . 孙海燕 ,杜欣娜 ,樊伟平 . 临床检验杂志 . 2018,第8期
4. 基于免疫相关lncRNA构建晚期乳腺癌预后预测模型 [J] . 高涵琛 ,杨沐 ,王庆庆 . 实用妇科内分泌电子杂志 . 2020,第15期
5. 基于SEER数据库建立三阴性乳腺癌预后预测模型列线图 [J] . 曲南坤 ,梁爽 ,孔启超 . 重庆医学 . 2021,第020期
6. 基于本体推理的农业大数据处理方法——以玉米多组学数据分析为例 [C] . 刘建晓 . 第三届农业信息化发展论坛暨新技术交流会 . 2016
7. 宫颈癌的临床病理特点分析及基于多组学数据的预后预测模型构建 [A] . 周晓爽 . 2020

基于多组学数据的乳腺癌预后预测模型构建

摘要

著录项

相似文献

相关主题

期刊订阅