首页> 中文学位 >基于血凝素蛋白序列的甲型流感病毒抗原性变异预测研究
【6h】

基于血凝素蛋白序列的甲型流感病毒抗原性变异预测研究

代理获取

目录

声明

摘要

1 绪论

1.1 研究背景及意义

1.2 国内外研究概括

1.3 甲型流感病毒抗原性变异预测研究理论知识

1.3.1 流感病毒

1.3.2 数据库介绍

1.3.3 甲型流感病毒抗原性预测概述

1.4 论文研究内容与结构安排

2 甲型流感病毒抗原性变异预测的研究进展

2.1 引言

2.2 标准数据集的构建

2.3 血凝素蛋白序列相似性信息的提取

2.4 关键性位点的筛选

2.4.1 根据先验知识手动筛选

2.4.2 最大相关性最小冗余度(MRMR)

2.4.3 线性模型权值筛选法

2.4.4 主成分分析(PCA)

2.5 预测分类算法介绍

2.5.1 C4.5决策树算法

2.5.2 BP神经网络

2.6 预测性能评价指标

2.6.1 评估方法

2.6.2 评价指标

2.7 本章小结

3 联合随机森林算法的甲型流感病毒抗原性变异预测

3.1 引言

3.2 数据集

3.3 特征和模型的构建

3.3.1 氨基酸指数数据库的介绍

3.3.2 特征及反应变量的构建

3.3.3 随机森林算法的初步分析

3.3.4 联合模型的构建

3.4 结果分析与讨论

3.4.1 系统分析各替换矩阵预测效果

3.4.2 驱使甲型流感(H3N2)发生抗原性变异的关键性位点

3.4.3 驱使抗原性漂移事件的突变

3.4.4 新序列的预测及与遗传距离的比较

3.4.5 模型的评价

3.4.6 本章小结

基于矩阵填充算法的甲型流感病毒抗原性变异预测

4.1 引言

4.2 数据集与模型的构建

4.2.1 数据集

4.2.2 模型的构建

4.3 序列相似信息的提取及模型的求解

4.3.1 序列相似信息的提取

4.3.2 模型的求解

4.4 抗原性图谱,遗传图谱以及进化树的构建

4.5 结果与讨论

4.5.1 参数的筛选

4.5.2 预测结果的簇间距离和簇内距离

4.5.3 结果评估与比较

4.6 本章小结

5 总结与展望

参考文献

攻读研究生期间的研究成果

致谢

展开▼

摘要

及时的鉴定新出现流感病毒的抗原性变异对于流感疫苗的设计、流感的监督以及人们的生命健康都是至关重要的。传统的实验方法(例如血凝抑制试验)虽然预测效果不错,但仍有不少缺点和不足:费时又费力,不能及时有效的对流感起到监控作用;有些实验无法顺利进行而导致获取的血清学数据比较稀疏(含有大量的缺失值);测量值存在人为和系统误差故而最终的血清学数据中有不少值过低。为了加速对流感病毒抗原性变异的预测及提升预测质量,基于流感病毒血凝素蛋白序列的生物信息学方法不断的被提出。本文通过提取血凝素蛋白的序列信息并结合对应血清学数据对甲型流感病毒的抗原性变异进行分析和预测,主要研究内容如下:
  1.综述了近几年国内外甲型流感病毒抗原性变异的预测研究进展,主要是针对血凝素蛋白序列的特征提取以及预测分类算法。常见的特征表示有二进制表示,按氨基酸物化性质分组提取等。采用的预测分类算法主要有矩阵填充,K近邻,支持向量机,逻辑斯蒂卡回归,套索算法等。
  2.提出了一种基于血凝素蛋白序列的联合随机森林算法(JRFR),用于直接预测甲型流感病毒的抗原性距离。我们的算法结合94种氨基酸替换矩阵及HA1对甲型流感病毒的抗原性距离进行预测,不仅提升了预测精度而且对新的病毒序列的抗原性变异有很好的预测效果。
  3.提出了一种基于血凝素蛋白序列的矩阵填充算法(BMCSI),用于填充和矫正原本过于稀疏的及含有很多不稳定值的血凝素抑制试验测试数据,从而得以更精确的计算各病毒间的抗原性距离,并通过多维尺度分析(MDS)算法将其抗原性距离映射到二维空间,从而将甲型流感病毒抗原性距离可视化。我们的方法在1968-2003年数据上的预测精度比之前的研究提升了37%(RMSE=0.6586)。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号