Gene time series; clustering; energy based measure;
机译:通过正则样条回归和基于能量的相似性度量对时间基因表达数据进行聚类
机译:改进的基于相关系数的相似度度量用于聚类时程基因表达数据
机译:基于数据序列的变窗相似性度量来估算不完整的时间序列数据
机译:基于连续表示的基因时间序列数据聚类和基于能量的相似度测量
机译:鲁棒的基于动力学模型的数据表示和时序数据的结构化,以进行序列内定位
机译:基于短时间序列依赖性的可靠相似性度量:在基因表达网络中的应用
机译:图4:(a)一种保守序列,其发生在芯片-SEQ数据集中的46,264个结合位点峰值中的79倍。说明了这种保守序列的突变分布,其中'_'表示该碱度不变; del表示此基础丢失; INS X表示新的基础X插入此基础前面。 (b)列出了几种重复的元素模式。 (c)在第一栏中,示出了由MEME芯片工具(Machanick&Bailey,2011)开采的前五个DNA主题。由CFSP算法发现的相应保守序列列于第二列中。在第三列中,列出了从突变信息转换的特定位置的评分矩阵。 MEME主题与PSSM格式的相似性与PSSM格式之间的相似性通过邮票图章比较工具(Mahony&Benos,2007)计算。这些对相似性的电子值显示在第四列中。 (d)在由GKMSVM描述符聚集的每个组中选择了一个图案,下面列出了CFSP算法的相应主题。 (e)从https://www.encodeproject.org收集的,有附加数据集(文件no:cernff100grl,cenf616irl,conf8.20cer,target:srebf1)。使用MEME工具在每个文件中选择前两个图案,并且我们的算法发现的相应主题如下所示。