基于从头算法的转座子识别方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

转座子(Transposable Elements，TE)是可移动的、重复的基因序列，它们在真核基因组中几乎无所不在，并对基因组的结构、功能和进化起到了十分重要的作用。目前，对转座子的研究已经非常深入，从转座子的鉴定和注释，再到对其详细的分类都有了相应的成熟软件或分析工具。
　　论文首先总结和分析比较了各种主要的关于转座子的相关软件方法，通过各个方法的比较，我们知道De novo(从头)算法虽然在其得到的转座子家族序列在以后的研究中需要进一步的修正，但它却是在鉴定、注释新基因组中转座子所必要的一步，也通常是全面处理的第一步，其结果对之后的研究中更是能产生深远的影响，但在得到的转座子家族序列以后的研究中尚需要进一步的修正，由此我们对其从头算法进行了改进。
　　本研究主要改进的是基于从头算法中的Repeatscout软件，它主要用于发现新的、未注释的转座子家族，对于高频出现的转座子的鉴别尤其有效。其主要优点则是不用与已知的数据库相比较，而主要的缺点是运行时间较长。首先提出了改进的理论依据并阐述了原算法的实现过程，在实现过程中主要是考虑了数据的冗余现象，不仅包括在得到转座子家族的多序列比对中的整体的遍历计算，也考虑了在“隐藏”序列过程中的双序列比对的遍历过程，通过分析其转座子数据的特征性，我们归纳其特征实现了以上两种去除数据的冗余的方法。再者，我们考虑到其碱基序列的本身只要4种情况，而这个改进可以在理论上真正做到无误差的去除冗余情况。
　　研究结果表明，在整个算法的实现中，我们总结出了其转座子家族得到的过程可分为四个步骤:(1)从序列中计算得到k-mer种子，并给出每个k-mer种子详细“注释”;(2)依据不同的标准来选取一个k-mer种子;(3)通过选取的k-mer种子进行多序列比对来得到转座子家族，再通过双序列比对来在序列中来“隐藏”出现过的k-mer种子及其序列;(4)调整k-mer种子频率及其他注释再次来选取一个种子。
　　本研究中，我们不仅对选取k-mer种子的标准进行了一定的改进，使其在选取种子的标准更加的严谨，这也是本文中对此算法的创新点所在，而且在考虑的造成运行时间长的三种去除冗余的方法方面，最后通过结果比对，包括其精度的比较和运行时间的比较，在一致的选取K-mer种子标准下，我们改进之后的算法结果在其精度未损失的情况下，其运行时间也得到了一定的减少。

著录项

作者
靳佩;
展开▼
作者单位

重庆邮电大学;

展开▼
授予单位重庆邮电大学;
学科计算机技术
授予学位硕士
导师姓名蔡应繁;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类算法理论 ; 基因工程（遗传工程） ;
关键词
转座子; 识别方法; 隐马尔科夫模型; 从头开始算法; 基因序列;

相似文献

中文文献
外文文献
专利

1. 基于朴素贝叶斯算法的避雷器缺陷识别方法研究 [J] . 李亚锦 ,刘英男 ,张婉莹 . 电工电气 . 2022 ,第1期
2. 基于改进YOLOV3算法的弹库目标识别方法研究 [J] . 何伟鑫 ,邓建球 ,刘爱东 . 现代电子技术 . 2021 ,第013期
3. 基于改进SSD算法的安全驾驶行为识别方法研究 [J] . 施冬梅 . 现代电子技术 . 2021 ,第011期
4. 基于改进BOF算法的压板状态识别方法研究 [J] . 陈月卿 ,胡琳 ,吴毅翔 . 陕西电力 . 2021 ,第002期
5. 基于Prophet时序算法的无线网络突变小区识别方法研究 [J] . 杨飞虎 ,许国平 ,刘贤松 . 邮电设计技术 . 2021 ,第002期
6. 基于彩色信息融合和同伦算法的遮挡鲁棒人脸识别方法研究 [C] . 翟懿奎 ,甘俊英 ,李景文 . 第十五届全国信号处理学术年会 . 2011
7. 基于深度学习和串联质谱离子信息的蛋白质从头测序方法研究 [A] . 狄磊 . 2020

基于从头算法的转座子识别方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅