机译:随机森林发现CIS-incumatory元素细胞型特异性DNA主题语法
机译:全基因组的计算和表达分析表明,G-四链体DNA基序是人类和相关物种中保守的顺式调控元件
机译:全基因组的顺式调控元件结构分析和基元驱动的葡萄基因共表达网络的发现
机译:RPPMD(随机预测可能的基序发现):一种用于发现植有DNA的母题的有效存储方法
机译:集成系统生物学数据存储库以改善顺式调控基序的表征和发现:一种解决老难题的绝妙方法。
机译:使用随机森林在顺式调控元件中发现细胞类型特异性DNA基序语法
机译:图4:(a)一种保守序列,其发生在芯片-SEQ数据集中的46,264个结合位点峰值中的79倍。说明了这种保守序列的突变分布,其中'_'表示该碱度不变; del表示此基础丢失; INS X表示新的基础X插入此基础前面。 (b)列出了几种重复的元素模式。 (c)在第一栏中,示出了由MEME芯片工具(Machanick&Bailey,2011)开采的前五个DNA主题。由CFSP算法发现的相应保守序列列于第二列中。在第三列中,列出了从突变信息转换的特定位置的评分矩阵。 MEME主题与PSSM格式的相似性与PSSM格式之间的相似性通过邮票图章比较工具(Mahony&Benos,2007)计算。这些对相似性的电子值显示在第四列中。 (d)在由GKMSVM描述符聚集的每个组中选择了一个图案,下面列出了CFSP算法的相应主题。 (e)从https://www.encodeproject.org收集的,有附加数据集(文件no:cernff100grl,cenf616irl,conf8.20cer,target:srebf1)。使用MEME工具在每个文件中选择前两个图案,并且我们的算法发现的相应主题如下所示。