首页> 中文学位 >抗癌药物反应预测模型中的特征选择算法研究
【6h】

抗癌药物反应预测模型中的特征选择算法研究

代理获取

目录

声明

1 绪论

1.1 研究背景及意义

1.1.1 癌症与精准医疗

1.1.2 抗癌药物筛选的研究与发展

1.1.3 研究意义

1.2 研究现状及分析

1.2.1 几大药物基因组学数据库

1.2.2 抗癌药物反应预测的研究现状

1.2.3 高维数据特征筛选问题的研究现状

1.3 研究内容及本文结构

2 药物基因组学数据描述及可视化

2.1 抗癌药物反应值

2.2 癌细胞系基因组数据

2.3 相关性分析

2.4 本章小结

3 基于基因表达数据的特征选择

3.1 高维数据的评价筛选

3.1.1 基于Pearson相关系数的假设检验

3.1.2 SIRS算法

3.2 惩罚最小二乘估计与变量选择

3.2.1 最小二乘法

3.2.2 LASSO算法

3.2.3Elastic Net算法

3.2.4 SCAD算法

3.3 特征选择结果

3.4 本章小结

4 抗癌药物反应预测的回归模型

4.1 交叉验证与模型的性能度量

4.2 惩罚回归模型构建

4.3 CCLE数据的模型预测结果

4.3.1 相关系数结果对比

4.3.2 基于不同特征选择方法的回归算法模型结果对比

4.4基于SIRS_Elastic Net算法的肺部癌细胞系的药物反应预测

4.4.1 抗癌药物反应预测模型结果

4.4.2 基因富集分析

4.5 本章小结

结论与展望

参 考 文 献

致谢

大连理工大学学位论文版权使用授权书

展开▼

摘要

大量临床数据表明,患有同种癌症的不同患者,由于病人基因的特异性,对同一种治疗手段或药物往往有不同的反应。因此考虑基因特异性影响的靶向药物治疗已成为一种新兴的癌症治疗手段。然而病人体内是否存在抗癌药物的靶向基因对治疗效果影响较大,并且临床上抗癌药物的筛选研究存在多方面的挑战:实验环境要求高、等待反应时间长以及耗资巨大等。生物信息学的快速发展,将肿瘤细胞的基因组数据与药物相关数据整合成大型数据库,结合机器学习算法在细胞水平上对药物反应进行预测,为多种靶向抗癌药物的筛选提供有利依据。本文基于肿瘤细胞系的基因表达数据和抗癌药物反应值IC50,进行特征选择算法的研究,从而建立可靠准确的抗癌药物反应预测模型,主要包括以下三方面的工作: (1)对CCLE中的癌细胞系基因组数据与抗癌药物反应数据进行关联性分析,发现基因表达数据分布集中并且与IC50之间的相关性较为显著,更适用于预测药物反应。然后结合药物反应值计算相关系数的假设检验p值,按一定阈值选择的基因之间存在群组相关性,为后续工作中特征选择算法的研究以及回归模型的构建提供一定的依据。 (2)针对基因特征数据的“维数灾难”问题,将处理高维特征的评价筛选与惩罚最小二乘系数收缩的方法结合使用。首先使用SIRS算法计算21种抗癌药物的IC50与各个基因表达的边际度量值进行初步筛选,并使用Pearson相关系数的假设检验进行对比;然后结合不同的惩罚最小二乘系数收缩的方法:LASSO、Elastic Net、SCAD,作精确特征选择,为建立可靠的回归预测模型提供有效的预测变量。 (3)由于SIRS算法更适用一般模型,且Elastic Net兼顾LASSO与岭回归的变量选择与群组效应优势,研究中使用SIRS_Elastic Net方法进行特征选择,并与CCLE数据发布的论文中的Elastic Net算法模型进行对比,并且比较评价筛选与系数收缩的不同结合对模型结果的影响。然后对肺部癌细胞系单独进行预测分析,并且通过对预测基因变量的富集分析来了解基因的分子生物学功能信息以及在信号通路中的作用。 本文基于CCLE数据对21种抗癌药物反应进行预测,侧重于回归模型中的特征选择算法研究,将评价筛选与系数收缩进行有效结合,采用SIRS_Elastic Net作特征选择,提高了模型预测的准确度,大多数药物得到的决定系数达到0.7以上,同时对肺癌进行单独研究的预测模型决定系数达到0.95左右。并且通过富集分析发现预测基因所对应的分子功能及通路信息与抗癌药物具有生物学相关性,这为后续研究药物的靶向基因提供了一定的基础,同时有助于新的抗癌药物的筛选研究。

著录项

  • 作者

    孙七凡;

  • 作者单位

    大连理工大学;

  • 授予单位 大连理工大学;
  • 学科 控制工程
  • 授予学位 硕士
  • 导师姓名 顾宏;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类
  • 关键词

    抗癌; 药物反应; 预测模型; 特征选择;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号