首页> 中文学位 >基因结构预测软件的测评及翻译起始位点预测
【6h】

基因结构预测软件的测评及翻译起始位点预测

代理获取

摘要

基因结构预测对于发现新基因、了解基因组结构规律具有重要作用,是各类基因组计划的重要内容。对于真核生物,多个基因结构预测软件在通用数据集上的预测精度已达到较高水平。然而自这些数据集构建以来,已有大量新蛋白质编码基因被确认,基因结构特征的统计结果已有了较大的变化,构建新的数据集并重新测评基因结构预测软件的研究工作变得十分紧迫和必要。为此,在全基因组范围内进行了基因结构预测软件的测评。
   本研究利用新构建的BEN数据集对多个具有代表性的基因结构预测软件进行了系统地测评,发现基因结构预测软件的预测精度明显低于国际上以前报道的结果,特别是对低C+G含量的基因序列,以及长内含子、短外显子和翻译起始位点等基因结构特征的预测精度偏低,对超短外显子(<25bp)中3n长度类型外显子的预测精度明显高于3n+I长度类型外显子。针对翻译起始位点预测精度不高的缺点,研制了相应的预测软件。通过分析目前预测时广泛使用的特征,发现真实和潜在假翻译起始位点的特征与AUG密码子附近序列的C+G含量具有很强的依赖性,以及潜在假翻译起始位点部分特征的统计结果随潜在假翻译起始位点在mRNA序列上位置的不同而变化,并设计了多个支持向量机融合所有的特征,研发了翻译起始位点预测软件TISKey。对广泛使用的数据集交叉验证的结果显示,TISKey的预测精度明显优于以前报道的结果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号