首页> 外文期刊>RSTI >Biclustering des données de biopuces par les arbres pondérés de plus long préfixe: Modélisation discrète des données de puces à ADN
【24h】

Biclustering des données de biopuces par les arbres pondérés de plus long préfixe: Modélisation discrète des données de puces à ADN

机译:通过具有较长前缀的加权树对微阵列数据进行聚类:微阵列数据的离散建模

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

Les arbres pondérés de plus long préfixe (WLPTs) sont introduits pour modéliser et analyser les données de puces à ADN. Ils permettent d''examiner le problème de bicluster pour l''appliquer à la fouille de données. Nous fournissons un algorithme de permutations successives pour réduire le nombre de nœuds dans les WLPTs afin de compresser les données. Ces algorithmes permettent également de trouver des biclusters maximaux (globaux et locaux). Expérimentalement, nous montrons que le problème de biclustering est effectué en temps linéaire par les WLPTs. Un autre avantage des WLPTs est qu ''ils permettent de reconstruire des diagrammes de Hasse associés à un treillis de Galois et d''en extraire les concepts formels dans le contexte de la fouille de données.%Weighted longest prefix trees (WLPTs) are introduced for modelling and analyzing DNA microarray data. They enable to examine the problem of biclustering to apply for the data mining step in the process of knowledge discovery in databases (KDD). We give an algorithm of successive permutations to reduce number of nodes in the WLPTs in order to compress the data. These algorithms enable also to find maximal (global and local) biclusters. Experimentally, we show that the problem of biclustering is carried out in linear time by use of the WLPTs. Another advantage of the WLPTs is that they enable to deduce the Hasse diagram associated to a Galois lattices and to extract its formal concepts in the context of data mining.
机译:引入了加权最长前缀树(WLPT)来建模和分析微阵列数据。它们使您可以检查bicluster的问题,以将其应用于数据挖掘。我们提供了一种连续置换算法来减少WLPT中的节点数,以便压缩数据。这些算法还可以找到最大的二元组(全局和局部)。从实验上,我们表明WLPT在线性时间内执行了双重聚类问题。 WLPT的另一个优点是,它们可以重建与Galois格相关的Hasse图,并可以在数据挖掘的背景下从中提取形式概念。%加权最长前缀树(WLPT)是介绍了用于建模和分析DNA微阵列数据的方法。它们使您能够检查在数据库中的知识发现(KDD)过程中用于数据挖掘步骤的双重集群问题。我们给出了一种连续排列的算法,以减少WLPT中的节点数,以便压缩数据。这些算法还可以找到最大(全局和局部)双峰。通过实验,我们表明,通过使用WLPT,在线性时间内完成了双簇问题。 WLPT的另一个优点是,它们可以推导与Galois格关联的Hasse图,并可以在数据挖掘的背景下提取其形式概念。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号