首页> 外文期刊>Bioinformatics >CAAT-Box, contigs-Assembly and Annotation Tool-Box for genome sequencing projects
【24h】

CAAT-Box, contigs-Assembly and Annotation Tool-Box for genome sequencing projects

机译:用于基因组测序项目的CAAT-Box,contigs-Assembly和Annotation工具箱

获取原文
获取原文并翻译 | 示例
           

摘要

Motivation: Contigs-Assembly and Annotation Tool-Box (CAAT-Box) is a software package developed for the computational part of a genome project where the sequence is obtained by a shotgun strategy. CAAT-Box contains new tools to predict links between contigs by using similarity searches with other whole genome sequences. Most importantly, it allows annotation of a genome to commence during the finishing phase using a gene-oriented strategy. For this purpose, CAAT-Box creates an Individual Protein file (IPF) for each ORF of an assembly. The nucleotide sequence reported in an IPF corresponds to the sequence of the ORF with 500 additional bases before the ORF and 200 bases after. For annotation, additional information like Blast results can be added or linked to the IPFs as well as automatic and/or manual annotations. When a new assembly is performed, CAAT-Box creates new IPFs according to the old IPF panel. CAAT-Box recognizes the modified IPFs which are the only ones used for a new automatic analysis after each assembly. Using this strategy, the user works with a group of IPFs independently of the closure phase progression. The IPFs are accessible by a web server and can therefore be modified and commented by different groups. Result: CAAT-Box was used to obtain and to annotate several complete genomes like Listeria monocytogenes or Strepcoccus agalactiae.
机译:动机:重叠群和注释工具箱(CAAT-Box)是为基因组计划的计算部分开发的软件包,其中的序列是通过a弹枪策略获得的。 CAAT-Box包含新工具,可通过与其他全基因组序列进行相似性搜索来预测重叠群之间的链接。最重要的是,它允许使用基因导向策略在完成阶段开始注释基因组。为此,CAAT-Box为装配体的每个ORF创建一个单个蛋白质文件(IPF)。 IPF中报告的核苷酸序列与ORF的序列相对应,在ORF之前有500个其他碱基,在ORF之后有200个碱基。对于注释,可以添加其他信息(例如Blast结果)或将其链接到IPF以及自动和/或手动注释。执行新装配时,CAAT-Box将根据旧的IPF面板创建新的IPF。 CAAT-Box可以识别修改后的IPF,这是每次组装后用于新的自动分析的唯一IPF。使用此策略,用户可以与一组IPF无关地独立于封闭阶段进行。 IPF可通过Web服务器访问,因此可以由不同的组进行修改和注释。结果:CAAT-Box用于获得和注释几个完整的基因组,如单核细胞增生李斯特菌或无乳链球菌。

著录项

  • 来源
    《Bioinformatics》 |2004年第5期|p. 790-797|共8页
  • 作者单位

    Genopole, Institut Pasteur, 28 rue du Dr Roux, 75724 Paris Cedex 15, France;

    Laboratoire de Genomique des Microorganismes Pathogenes, Institut Pasteur, 28 rue du Dr Roux, 75724 Paris Cedex 15, France;

    Laboratoire de Genomique des Microorganismes Pathogenes, Institut Pasteur, 28 rue du Dr Roux, 75724 Paris Cedex 15, France;

    Laboratoire de Genomique des Microorganismes Pathogenes, Institut Pasteur, 28 rue du Dr Roux, 75724 Paris Cedex 15, France;

    Laboratoire de Genomique des Microorganismes Pathogenes, Institut Pasteur, 28 rue du Dr Roux, 75724 Paris Cedex 15, France;

    Genopole, Institut Pasteur, 28 rue du Dr Roux, 75724 Paris Cedex 15, France;

    Laboratoire de Genomique des Microorganismes Pathogenes, Institut Pasteur, 28 rue du Dr Roux, 75724 Paris Cedex 15, France;

  • 收录信息 美国《科学引文索引》(SCI);美国《化学文摘》(CA);
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类 生物科学;生物工程学(生物技术);
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号