基于主成分分析和神经网络的癌症驱动基因预测模型

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

癌症是人类生命和健康的主要威胁之一，它不仅给个人和家庭造成沉重的精神压力和经济负担，也严重影响了全球的经济发展和社会进步。癌症产生机制及其控制研究已经成为全球性的卫生战略研究重点。既往癌症的研究主要集中在寻找其外部诱因，对于内在的致癌机理知之甚少，直到高通量测序技术等方法的出现，使得从基因水平分析内因成为可能。通过分析癌症形成过程中细胞内基因表达水平的变化，人们发现有些基因能够对肿瘤起控制作用，如果抑制这些基因表达或基因通路，就可以终止肿瘤发展的相关事件，这些基因被称为癌症驱动基因。驱动基因是决定癌症的最主要内部原因，针对驱动基因靶向治疗，癌症治疗就可能事半功倍。
　　目前，我们主要通过分析大量样本的序列比对结果来预测癌症驱动基因，这种基于生物学的方法易于理解，但往往需要对大量的癌症样本进行测序，花费昂贵。随着分子生物学的快速发展，诸如TCGA(The Cancer Genome Atlas)等组织为研究者提供了数量庞大且更新及时的数据资源，此外，机器学习、数据挖掘等技术的涌现为分析这些数据提供了强大的支撑。驱动基因预测逐渐向数据化方向发展。
　　本文介绍了驱动基因的研究背景、意义和方法，并对主成分分析方法和神经网络的基本原理及在本文中的应用做详细分析介绍。基于这两种方法，我们提出了一种用于预测癌症驱动基因的系统生物学模型，该模型能够从微阵列数据出发逐步得到驱动基因预测集，降低实验过程中相关步骤的系统误差和人为误差，可以有效地减少经费支出和实验周期，为癌症的靶向治疗提供依据。本文选取多形性胶质母细胞瘤作为实验对象进行验证。首先，对实验样本数据进行预处理，对肿瘤表达谱数据进行归一化等处理，之后利用主成分分析方法进一步过滤无表达信息或者表达信息过低的表达数据;其次，受模块网络的启发，对筛选出的基因进行划分，将具有相似突变率的基因划分在同一个块中，并对块进行排序;最后，通过受限玻尔兹曼机学习得到驱动基因的预测集，并将预测结果和文本挖掘的结果进行比较，发现有80％左右的基因符合文本挖掘的结果，证明本文提出的模型具有一定的可行性和有效性。

著录项

作者
周莉;
展开▼
作者单位

北京交通大学;

展开▼
授予单位北京交通大学;
学科计算机科学与技术
授予学位硕士
导师姓名刘一;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类肿瘤病因学、发生学;
关键词
肿瘤学; 驱动基因; 预测模型; 主成分分析法; 神经网络;
入库时间 2022-08-17 10:18:57

相似文献

中文文献
外文文献
专利

1. 基于主成分分析的 BP 神经网络和 RBF 神经网络月平均气温预测模型 [J] . 牛志娟 ,胡红萍 . 高师理科学刊 . 2015,第011期
2. 基于主成分分析法和神经网络的技改工程造价预测模型 [J] . 妙旭娟 ,刘锦明 ,高亮 . 内蒙古科技与经济 . 2019,第019期
3. 高速公路收购价值研究——基于非线性主成分分析和RBF神经网络预测模型 [J] . 刘凯峥 ,王振国 . 中国市场 . 2019,第030期
4. 基于核主成分分析与改进神经网络的电力负荷中期预测模型 [J] . 孙新程 ,孔建寿 ,刘钊 . 南京理工大学学报（自然科学版） . 2018,第003期
5. 基于主成分分析和RBF神经网络的公路货运量预测模型 [J] . 蒋林利 . 长春教育学院学报 . 2013,第004期
6. 基于多线性主成分分析和径向基神经网络的储粮温度变化预测 [C] . 王孝成 ,廉飞宇 ,张元 . 中国粮油学会第九届学术年会 . 2018
7. 基于非线性主成分分析与神经网络的参数预测模型 [A] . 邱添 . 2007

基于主成分分析和神经网络的癌症驱动基因预测模型

目录

摘要

著录项

相似文献

相关主题

期刊订阅