Biclustering des données de biopuces par les arbres pondérés de plus long préfixe: Modélisation discrète des données de puces à ADN

Trang Tran; Cam Chi Nguyen; Ngoc Minh Hoang

首页> 外文期刊>RSTI >Biclustering des données de biopuces par les arbres pondérés de plus long préfixe: Modélisation discrète des données de puces à ADN

【24h】

Biclustering des données de biopuces par les arbres pondérés de plus long préfixe: Modélisation discrète des données de puces à ADN

机译：通过具有较长前缀的加权树对微阵列数据进行聚类：微阵列数据的离散建模

获取原文

获取原文并翻译 | 示例

获取外文期刊封面目录资料

开具论文收录证明 >>

文献代查 >>

文献数据库（团队版） >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

Les arbres pondérés de plus long préfixe (WLPTs) sont introduits pour modéliser et analyser les données de puces à ADN. Ils permettent d''examiner le problème de bicluster pour l''appliquer à la fouille de données. Nous fournissons un algorithme de permutations successives pour réduire le nombre de nœuds dans les WLPTs afin de compresser les données. Ces algorithmes permettent également de trouver des biclusters maximaux (globaux et locaux). Expérimentalement, nous montrons que le problème de biclustering est effectué en temps linéaire par les WLPTs. Un autre avantage des WLPTs est qu ''ils permettent de reconstruire des diagrammes de Hasse associés à un treillis de Galois et d''en extraire les concepts formels dans le contexte de la fouille de données.%Weighted longest prefix trees (WLPTs) are introduced for modelling and analyzing DNA microarray data. They enable to examine the problem of biclustering to apply for the data mining step in the process of knowledge discovery in databases (KDD). We give an algorithm of successive permutations to reduce number of nodes in the WLPTs in order to compress the data. These algorithms enable also to find maximal (global and local) biclusters. Experimentally, we show that the problem of biclustering is carried out in linear time by use of the WLPTs. Another advantage of the WLPTs is that they enable to deduce the Hasse diagram associated to a Galois lattices and to extract its formal concepts in the context of data mining.

机译：引入了加权最长前缀树（WLPT）来建模和分析微阵列数据。它们使您可以检查bicluster的问题，以将其应用于数据挖掘。我们提供了一种连续置换算法来减少WLPT中的节点数，以便压缩数据。这些算法还可以找到最大的二元组（全局和局部）。从实验上，我们表明WLPT在线性时间内执行了双重聚类问题。 WLPT的另一个优点是，它们可以重建与Galois格相关的Hasse图，并可以在数据挖掘的背景下从中提取形式概念。％加权最长前缀树（WLPT）是介绍了用于建模和分析DNA微阵列数据的方法。它们使您能够检查在数据库中的知识发现（KDD）过程中用于数据挖掘步骤的双重集群问题。我们给出了一种连续排列的算法，以减少WLPT中的节点数，以便压缩数据。这些算法还可以找到最大（全局和局部）双峰。通过实验，我们表明，通过使用WLPT，在线性时间内完成了双簇问题。 WLPT的另一个优点是，它们可以推导与Galois格关联的Hasse图，并可以在数据挖掘的背景下提取其形式概念。

著录项

来源
《RSTI》 |2008年第1期|p.83-108|共26页
作者
Trang Tran; Cam Chi Nguyen; Ngoc Minh Hoang;
展开▼
作者单位

Centre Intégré de Bioinformatique - Université de Lille 2 1 Place Verdun, F-59045 Lille cedex;

展开▼
收录信息
原文格式 PDF
正文语种 fre
中图分类数理科学和化学;
关键词
modélisation discrète; combinatoire des mots; arbres pondérés; fouille de données; classification; biclustering; treillis de Galois; puces à ADN;

机译：离散建模;单词组合;加权树;数据挖掘;分类;双聚类;Galois格;DNA芯片;

相似文献

外文文献
中文文献
专利

1. Qualité des données : conception du schéma de la base de données en utilisant l'ingénierie dirigée par les modèles: Un outil de conception de base de données relationnelle utilisant les métamodèles de l'OMG [J] . Marie Christine Lafaye, Georges Louis, Antoine Wiedemann Ingenierie des Systemes d'Information . 2011,第5期

机译：数据质量：使用模型驱动的工程设计数据库模式：使用OMG元模型的关系数据库设计工具
2. Un simulateur haute performance des matériaux par couplage de la dynamique moléculaire avec les éléments finis: LibMultiScale, structures de données et techniques de parallélisation [J] . Guillaume Anciaux Technique et science informatiques . 2009,第3期

机译：通过将分子动力学与有限元耦合的高性能材料模拟器：LibMultiScale，数据结构和并行化技术
3. Modélisation du bilan hydrique du bassin versant du lac Ba Bê, Viêt-nam, à l'aide de données physiographiques issues de télédétection et de données climatologiques [J] . LAURIE ST-ONGE, FERDINAND BONN, ALAIN N. ROUSSEAU, Hydrological sciences journal . 2007,第4期

机译：使用来自遥感和气候数据的地貌数据对越南BaBê流域的水平衡进行建模
4. Modélisation des données multimédia réparties dans des réseaux client/serveur [C] . Cao Lieu NGUYEN, Soudougou M. KONATÉ 1995 Canadian conference on electrical and computer engineering : Conference proceedings . 1995

机译：在客户端/服务器网络中分发的多媒体数据的建模
5. Fusion des données provenant d'un système de paiement par cartes à puce, d'un système de compte à bord et d'horaire pour l'imputation d'arrêts d'embarquement en transport collectif [D] . Legare, Felix. 2014

机译：从智能卡支付系统中合并数据，船上的账户系统和集体运输登机锁定的时间表
6. Le libre accès aux données probantes : conseils utiles pour gagner un temps précieux et ressources dans la quête pour fournir des interventions de physiothérapie fondées sur des données probantes [O] . Linda McLean, Paola Durando 2018

机译：公开获取证据：在寻求基于证据的物理疗法干预的过程中节省宝贵时间和资源的有用提示
7. Reconstitution par arbres de régression du rayonnement visible descendant horaire sur la France continentale, à partir de données in situ et de simulations : Spatialisation et vérification sur des données indépendantes [O] . Brion D., Calvet Jean-Christophe, Le Moigne P., 2005

机译：通过就地数据和模拟从法国每小时向下可见辐射的回归树进行重构：独立数据的空间化和验证

Biclustering des données de biopuces par les arbres pondérés de plus long préfixe: Modélisation discrète des données de puces à ADN

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅