首页> 中文学位 >基于离散特征的蛋白质亚细胞定位预测方法研究
【6h】

基于离散特征的蛋白质亚细胞定位预测方法研究

代理获取

目录

文摘

英文文摘

论文说明:插图索引、附表索引

第1章 绪论

1.1 引言

1.2 选题背景和意义

1.3 研究现状

1.3.1 蛋白质序列图形表达

1.3.2 基于SVM的蛋白质亚细胞定位预测方法

1.4 本文主要研究工作与结构

第2章 蛋白质图形表达和SVM的相关知识与概念

2.1 蛋白质基础知识

2.1.1 蛋白质序列的组成

2.1.2 亚细胞结构及其功能

2.2 蛋白质序列的图形表达

2.2.1 蛋白质序列特征提取及图形表达构建

2.2.2 蛋白质图形表达的应用

2.2.3 方法分析与评价

2.3 基于SVM的分类预测方法

2.3.1 支持向量机的分类原理

2.3.2 特征向量的构建

2.3.3 基于SVM的亚细胞定位预测方法与评价

2.4 预测结果测试方法

2.5 小结

第3章 基于图形表达的蛋白亚细胞定位预测方法

3.1 引言

3.2 新图形表达的原理与方法

3.2.1 特征提取与图形构建

3.2.2 HR-Curve相关性质与证明

3.2.3 距离计算方法

3.3 新图形表达HR-Curve的应用与分析

3.3.1 蛋白质相似性分析与进化树构建

3.3.2 蛋白质亚细胞定位预测

3.4 小结

第4章 基于SVM的蛋白质亚细胞定位迁移预测方法

4.1 引言

4.2 迁移预测原理与方法

4.2.1 数据集选取及特征分析

4.2.2 蛋白质序列的特征提取与特征向量构建

4.2.3 迁移预测

4.3 迁移预测实验分析与方法比较

4.3.1 迁移预测模型的参数确定

4.3.2 对照实验结果比较与分析

4.3.3 与其它方法比较与分析

4.4 小结

结论

参考文献

致谢

附录A 攻读学位期间所发表的学术论文和参加的项目

展开▼

摘要

蛋白质亚细胞定位与蛋白质功能,结构及相互作用都密切相关,因此建立可靠的亚细胞定位预测模型对理解蛋白质机能,生命活动以及药物研发都具有重大的意义。以蛋白质字母序列为研究对象,基于数学方法和计算机技术的预测方法成为了研究重点。虽然目前已经提出了许多此类预测方法,但是仍存在两方面问题:一、预测方法的时间复杂度和空间复杂度仍然较高。二、不能有效解决数据量有限且数据分布极度不平衡的数据集的预测问题。针对这两个问题,本文提出了两个基于离散特征的新型预测模型,主要创新工作概括如下:
  首先本文提出了基于蛋白质序列图形表达HR-Curve的亚细胞定位预测模型。HR-Curve的构建基于氨基酸理化性质分类和双向量,HR-Curve具有高可视性,信息完备性,分类可视性以及多应用性等特点。同时根据HR-Curve的特点,本文提出了一种高效的基于欧式距离的相似度计算方法MAV,该方法很大程度上降低了时间复杂度和空间复杂度。最后将HR-Curve应用到亚细胞定位预测。实验证明HR-Curve在保持较高预测准确性的同时,明显有效地提高了预测效率。
  针对第二个问题,本文提出了基于SVM的亚细胞定位迁移预测模型。该模型基于改进的基于亲疏水性的氨基酸分类的特征提取方法和SVM的迁移学习思想。通过加入自适应检测条件,在保证预测准确率的同时,迁移学习的收敛速度得到了有效地提高。最后从两方面验证了该迁移预测模型的特点和优势:一方面通过设计对照实验,证明迁移预测模型对特殊数据集的适用性及高效性。另一方面通过与其他方法对比,进一步说明迁移预测模型的特点和前景。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号