首页> 中文学位 >基于支持向量机的基因剪接位点研究
【6h】

基于支持向量机的基因剪接位点研究

代理获取

摘要

人类基因组计划完成后,生命科学的研究进入了后基因时代。基因组的研究包括基因识别、信息结构分析以及功能预测等方面,识别真核基因剪切位点是基因识别中的重要的一环。剪切位点对基因表达有很大的影响,其能够直接决定、选择与合成哪种蛋白质,而蛋白质的种类直接决定着生物体的性状和功能,所以在国际生物信息学界剪接位点识别研究的重要性日益突出。在早期的研究中,人们使用最基本的生物实验方法识别剪切位点,但是这种生物实验的方法具有很大的局限性——同时仅能有限地检测一条或者是几条DNA序列,并且在实验过程中需要花费大量的人力和物力。生物科学与相关技术的发展积累了大量的生物学相关数据,也让人们认识到不能仅仅依靠生物实验来识别剪切位点,于是计算机技术走进了剪切位点识别这项任务中。由于识别剪切位点就能够直接从DNA序列中得到对应的蛋白质,因其对生物学具有重要的意义,本文使用支持向量机方法分析位于供体位点和受体位点之间的内含子序列与剪切位点的关联性。研究重点如下:
   1)分析了供体位点和受体位点之间的内含子序列对基因剪接的影响,并对内含子序列与剪接的关联性进行了研究。研究发现,内含子区别于伪内含子的特征信息同时存在于内含子两端,序列长度约为70个碱基,只要将内含子准确识别出来,就能准确地得到剪接位点。
   2)由于标准支持向量机容易受类别差异影响和噪声、野值数据干扰,进而影响识分类效果,本文提出一种将改进的支持向量机算法——加权近似支持向量机应用于剪接位点的识别中,结果表明加权近似支持向量机在预测剪接位点的准确率方面要优于标准支持向量机。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号