首页> 中文学位 >同源寡聚蛋白质的信息熵分类方法
【6h】

同源寡聚蛋白质的信息熵分类方法

代理获取

目录

文摘

英文文摘

独创性说明及大连理工大学学位论文版权使用授权书

1绪论

1.1同源寡聚蛋白质分类研究的背景

1.1.1人类基因组计划

1.1.2生物信息学

1.2同源寡聚蛋白质分类预测的意义

1.3国内外研究现状

1.4本文组织结构

2蛋白质基础知识

2.1蛋白质组成

2.2蛋白质结构层次

2.3维持和稳定蛋白质高级结构的因素

2.4蛋白质的生物学功能

3特征提取

3.1基于氨基酸序列的描述方法

3.1.1氨基酸组成成分特征提取法

3.1.2熵密度特征提取法

3.1.3完全信息集法

3.1.4多肽组成成分方法

3.2考虑氨基酸性质的描述方法

3.2.1自相关函数特征提取法

3.2.2准序列次序特征提取方法

3.2.3伪氨基酸组成特征提取方法

3.3特征提取方法的发展

4信息熵在蛋白质预测中的应用

4.1 信息熵

4.2叉熵

4.3 FDOD方法

4.3.1完全信息集

4.3.2 FDOD函数及其性质

4.4叉熵与FDOD方法的关系

4.5 FDOD方法的进一步思考

4.6基于信息熵对蛋白质建模

5对同源二聚体和同源非二聚体蛋白质分类

5.1方法描述

5.1.1数据集

5.1.2伪氨基酸组成成分特征提取

5.1.3 FDOD方法

5.1.4检验方法

5.2分类结果及讨论

5.2.1分类结果

5.2.2权重因子与分类总精度的关系

5.2.3数据集大小对分类的影响

5.2.4方法比较

总结

参考文献

附录A数据集1

附录B数据集2

攻读硕士学位期间发表学术论文情况

致谢

展开▼

摘要

人类基因组计划已进入到后基因组时代,对蛋白质结构和功能的研究和预测成为其主要的研究方向之一。由于通过实验确定蛋白质的结构和功能速度较慢,而且会遇到一些目前无法解决的困难。因此探索利用理论及计算方法来从氨基酸序列快速地推断出蛋白质的结构和功能具有重要意义。本文从氨基酸序列出发,研究了同源寡聚蛋白质分类,主要工作如下: 本文介绍了特征提取方法和同源寡聚蛋白质分类的研究现状,并对同源二聚体和同源非二聚体蛋白质使用了基于伪氨基酸组成成分特征提取和信息熵方法进行分类研究。伪氨基酸组成成分特征提取方法以传统的氨基酸组成成分为基础,又考虑了不同层次残基之间的相互影响,包含了蛋白质序列的许多信息,根据这一特点,本文使用了伪氨基酸组成成分作为特征提取方法。FDOD方法是基于信息熵的信息离散性度量函数,它和叉熵之间存在内在的联系,文中对它们之间的关系进行了研究,并在叉熵的基础上对多分布偏差度量进行了进一步的思考。由于FDOD是叉熵的一种形式,因此在它的基础上根据特征向量的提取情况,对同源寡聚蛋白质进行分类。其分类能力比使用子序列分布为2的FDOD方法要好。 本文中在原数据集中随机抽取一些数据构建了一个子数据集,并使用同样的方法对子数据集进行分类。比较了两个数据集的分类结果,表明数据集的大小对分类系统的影响较大。同时,对伪氨基酸组成成分特征提取方法的中权重因子的选取进行了讨论,说明它可用于调节氨基酸序列次序信息对分类系统的影响程度,在计算中可根据结果的优劣适当选取。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号