机译:通过基于字符串压缩的算法聚类发现数据集性质
CES Felipe II, Universidad Complutense de Madrid, Aranjuez, Spain;
Clustering algorithms; Compression algorithms; Context; Context modeling; Data compression; Dictionaries; Grammar; Normalized compression distance; PPMD order; compression-based text clustering; data compression; dendrogram silhouette coefficient; multidimensional projections; word removal;
机译:基于串压缩的算法聚类,以EEG信号中提取P300结构
机译:基于字符串压缩的音乐算法聚类
机译:基于LAPLACS的混合和EM算法在一组字符串上最佳串集群
机译:一种基于字符串压缩的算法聚类算法,在异种动物数据库中识别鸟类歌曲种类
机译:具有噪声扰动和聚类分析的进化计算,可从高维生物学数据中发现生物标志物集
机译:从计算机集群上的DNA数据库中发现签名的算法
机译:图4:(a)一种保守序列,其发生在芯片-SEQ数据集中的46,264个结合位点峰值中的79倍。说明了这种保守序列的突变分布,其中'_'表示该碱度不变; del表示此基础丢失; INS X表示新的基础X插入此基础前面。 (b)列出了几种重复的元素模式。 (c)在第一栏中,示出了由MEME芯片工具(Machanick&Bailey,2011)开采的前五个DNA主题。由CFSP算法发现的相应保守序列列于第二列中。在第三列中,列出了从突变信息转换的特定位置的评分矩阵。 MEME主题与PSSM格式的相似性与PSSM格式之间的相似性通过邮票图章比较工具(Mahony&Benos,2007)计算。这些对相似性的电子值显示在第四列中。 (d)在由GKMSVM描述符聚集的每个组中选择了一个图案,下面列出了CFSP算法的相应主题。 (e)从https://www.encodeproject.org收集的,有附加数据集(文件no:cernff100grl,cenf616irl,conf8.20cer,target:srebf1)。使用MEME工具在每个文件中选择前两个图案,并且我们的算法发现的相应主题如下所示。
机译:聚类压缩算法联合聚类/数据压缩概念