Bioinformatics Centre (Centre of excellence in Structural Biology and Bio-computing), Indian Institute of Science, Bangalore 560012, India;
Bioinformatics Centre (Centre of excellence in Structural Biology and Bio-computing), Indian Institute of Science, Bangalore 560012, India;
Center of Excellence in Bioinformatics, School of Biotechnology, Madurai Kamaraj University, Madurai 625021, Tamilnadu, India;
Bioinformatics Centre (Centre of excellence in Structural Biology and Bio-computing), Indian Institute of Science, Bangalore 560012, India;
Bioinformatics Centre (Centre of excellence in Structural Biology and Bio-computing), Indian Institute of Science, Bangalore 560012, India;
Sequence motifs; nucleotide and protein sequences; identi-cal motifs; dynamic programming; direct repeat and phylogenetic relationships;
机译:高效的生物序列自动精确基元发现算法
机译:解决生物序列中近似嵌套串联重复的基序对齐问题的算法
机译:解决生物序列中近似嵌套串联重复的基序对齐问题的算法
机译:一种在多种生物序列中找到所有相同图案的算法
机译:启发式算法,可最大程度地降低单机和相同并行机上的总加权拖尾率,并具有与序列相关的设置和未来准备时间
机译:一种检测生物序列的多重协方差和聚类的新算法
机译:图4:(a)一种保守序列,其发生在芯片-SEQ数据集中的46,264个结合位点峰值中的79倍。说明了这种保守序列的突变分布,其中'_'表示该碱度不变; del表示此基础丢失; INS X表示新的基础X插入此基础前面。 (b)列出了几种重复的元素模式。 (c)在第一栏中,示出了由MEME芯片工具(Machanick&Bailey,2011)开采的前五个DNA主题。由CFSP算法发现的相应保守序列列于第二列中。在第三列中,列出了从突变信息转换的特定位置的评分矩阵。 MEME主题与PSSM格式的相似性与PSSM格式之间的相似性通过邮票图章比较工具(Mahony&Benos,2007)计算。这些对相似性的电子值显示在第四列中。 (d)在由GKMSVM描述符聚集的每个组中选择了一个图案,下面列出了CFSP算法的相应主题。 (e)从https://www.encodeproject.org收集的,有附加数据集(文件no:cernff100grl,cenf616irl,conf8.20cer,target:srebf1)。使用MEME工具在每个文件中选择前两个图案,并且我们的算法发现的相应主题如下所示。