首页> 中文学位 >线虫神经肽和神经肽受体耦合特异性预测
【6h】

线虫神经肽和神经肽受体耦合特异性预测

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

1 绪论

1.1 生物信息数据库

1.2 蛋白质序列分析

1.3 隐马尔可夫模型(HMM)

1.4 交叉验证方法思想简介

1.5 本文研究内容

2 神经肽及神经肽受体数据收集

2.1 搜索数据库

2. 2 数据集搜索结果

3 线虫神经肽及神经肽受体耦合特异性预测

3.1 实验流程图

3.2 数据去冗余

3.3 膜拓扑结构预测

3.4 多序列比对

3.5 构建隐马尔可夫模型

3.6 HMM识别测试序列

4 总结与讨论

4.1 全文总结

4.2 讨论

致谢

参考文献

展开▼

摘要

迄今为止的实验数据表明神经肽在线虫体内的许多行为方面具有直接或间接的调节作用。在基因敲除实验中,已有报道称,这些编码神经肽基因的缺失会导致线虫运动、寿命、产卵、乙醇反应、社交行为等诸多功能的缺陷。
  虽然线虫中的神经肽具有如此重要的作用,但是对于各种神经肽的具体功能仍然是了解甚少的。在线虫神经肽功能研究领域,直接识别具有一定的困难度,从其他途径考虑,通过使与此神经肽结合的受体失去活性,然后观察线虫行为功能的缺陷,就可为此神经肽功能的明确提供有利条件。目前在线虫中通过生化实验验证的配体——受体对仍然只占少数,随着序列数据的大量增长和生物学实验的耗时耗力,需要借助生物信息学和序列数据挖掘方法来缩短实验周期以降低实验代价,因此理论预测神经肽和神经肽受体耦合特异性成为解决这个难题的主要方法之一。
  序列数据是数据挖掘问题中一类特殊数据,广泛存在于社会生活各个领域,如何从这些复杂海量序列数据库中挖掘蕴含其中的有用信息是数据挖掘的新研究课题,具有十分重要的实际价值和理论意义。本课题的研究对象——神经肽受体均为G蛋白耦联受体(GPCRs),这是一类重要的膜蛋白,有七次跨膜螺旋的特征。应用隐马尔可夫模型(HMM)以挖掘此类膜蛋白序列中有用信息,提取保守序列特征,从而构建HMMs提供对新样本的预测,即线虫中的神经肽受体。构建好的HMM模型可以代表有共同特征的蛋白质序列,对于多个描述不同种族蛋白质序列的HMM模型,选出最匹配测试序列的HMM模型。
  因此,本课题将围绕线虫神经肽受体序列分类预测这一主题,采用所有物种的神经肽受体序列数据作为数据集。数据集用来构建隐性马尔可夫模型,它包含所有物种的cholecystokininreceptor,galaninreceptor,neurotensinreceptor,neuropeptideYreceptor,somatostatinreceptor,tachykininreceptor,thyrotropinreleasinghormonereceptor,vasopressinreceptor这八类神经肽受体家族的蛋白质序列。使用五折交叉验证评估生成的这8个隐马尔可夫模型的精度,验证结果显示模型精度较高,应用到线虫内目前未经实验验证确定所属蛋白质家族的17种神经肽受体序列。每个神经肽受体序列逐一作为查询序列,由8HMMs分别计算生成出此序列的E值,E值最小的HMM所属家族即是预测所得的线虫神经肽受体所属的家族。从而实现了对线虫神经肽受体序列的分类预测,为生物学实验明确神经肽功能的研究设计提供了可靠依据。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号