首页> 中文学位 >蛋白质序列一级结构图形构造及相似性分析
【6h】

蛋白质序列一级结构图形构造及相似性分析

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪 论

1.1 研究背景和意义

1.2 研究现状

1.2.1 生物分析学中相似性研究

1.2.2图形表示方法的研究概况

1.2.3 系统发生树国内外研究现状

1.3 本文的研究

1.3.1 论文的主要内容

1.3.2 论文的框架结构

第二章 基于三维模型的蛋白质序列图形表示

2.1 蛋白质一级结构的三维空间离散点的构造

2.2基于三次B样条曲线的图形表示

2.2.1 选择空间插值曲线

2.2.2 反算控制点及B样条曲线构造

2.3 本章小结

第三章 蛋白质序列参数曲线的数值描述及相似性分析

3.1 空间曲线的特征提取

3.1.1 选择参数曲线的特征向量

3.1.2特征向量的相似性测度方法

3.2 蛋白质序列的相似性分析

3.2.1 不同物种间序列的比较

3.2.2 实验结果相关性验证

3.2.3 实验结果显著性验证

3.3 本章小结

第四章 基于聚类算法的系统发生树构建

4.1 聚类算法介绍

4.2蛋白序列图形表示及系统发生树构造

4.2.1 实验数据

4.2.2 实验过程

4.2.3 实验结果及分析

4.3 本章小结

第五章 总结和展望

5.1 本文工作总结

5.2 未来工作展望

参考文献

攻读硕士学位期间的研究成果

致谢

展开▼

摘要

近些年,随着基因数据库中的生物序列不断增多以及测序手段的不断完善,越来越多的国内外学者着力于对DNA序列与蛋白质序列的非序列组比对方法进行研究。基于非序列组比对方法比基于序列组比对方法具有更好的可视性,更好的局部特征等优点,所以可以更好地挖掘序列中局部的生物信息。本文基于非序列组比对的方法,提出一种新的蛋白质序列一级结构图形表示方法,对不同物种间的序列进行了相似性分析和系统发生树的构造,具体研究工作如下:
  1.本文基于氨基酸的疏水性、pKα(COOH)、 pKα(NH+3)这三种理化性质通过变换公式将蛋白质序列中的氨基酸映射到三维空间中,使其产生坐标并且均匀分布在空间象限里。然后再利用公式迭代求和获取蛋白质序列对应的三维空间坐标点,最后使用三次B样条插值样条曲线插值这些型值点,构造了一条光顺的蛋白质序列一级结构三维曲线。
  2.在得到蛋白质序列三维曲线之后,我们对其进行了特征提取,利用空间曲线的几何特性如曲率与挠率描述了蛋白质曲线在三维空间中弯曲与扭曲的程度。其次介绍了几种常用的特征向量相似性测度的方法,并且在基于Canberra距离的情况下,提出了一种新的循环Canberra距离方法,通过与ClustalW算法得到的标准结果作相关性比对证明了本文方法的可行性,然后又与其他文献方法做了比较,证明了本文方法的优越性。最后用相关系数显著性检验中的t检验方法证明了本文的实验结果不是偶然得到。
  3.基于蛋白质序列图形中特征向量相似性测度的结果,我们构造了相应的系统发生树。具体实验过程是用层次聚类方法分别描述了9个物种ND5蛋白序列和15个物种β球蛋白序列的进化距离并对它们进行了系统发生树的构建,同时与Mega和DNAstar软件中构建的系统发生树做了对比,验证了本文方法的可靠性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号