首页> 中文学位 >基于序列多信息融合的蛋白质亚细胞定位预测方法研究
【6h】

基于序列多信息融合的蛋白质亚细胞定位预测方法研究

代理获取

目录

展开▼

摘要

蛋白质的亚细胞定位与其功能密切相关。研究细胞中蛋白质定位的机制和规律,预测蛋白质的亚细胞定位,对于了解蛋白质之间的相互作用和功能具有重要意义。尽管传统的生物化学实验能够预测蛋白质的亚细胞定位,但是这种方法既耗时,成本又高。因此,我们迫切需要一些自动的、高效准确的蛋白质亚细胞定位预测方法。本文主要围绕这一主题,针对蛋白质序列的编码方法和分类预测算法两方面进行了研究,并在不同的数据集上分别进行了测试和分析。本文的主要创新工作概括如下:   本文基于氨基酸的物理化学属性提出了一种新的蛋白质序列特征提取方法。该方法将一条蛋白序列转化为146维的特征向量,其中包含20维的氨基酸基本组成和126维的三肽组分。为了评价预测性能,我们采用支持向量机作为分类方法,分别在三个不同数据集上进行自检验和刀切法检验。实验结果表明,此方法对蛋白质亚细胞定位预测是有效的。   为了进一步挖掘蛋白质序列中所包含的结构和功能信息,本文融合了氨基酸位置权重组分、二肽组成、氨基酸折射率相关系数三种特征,提出了一种新颖的蛋白质序列特征提取方法。该方法试图加入氨基酸的位置信息、局部顺序信息以及氨基酸残基之间的长程相关性。然后我们分别利用支持向量机和最近邻算法对凋亡蛋白和革兰氏阴性菌蛋白进行亚细胞定位预测。在刀切法检验下,两种分类算法都取得了较高的预测准确率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号