首页> 外文期刊>RSTI >Encodage linéaire d'automates pondérés: Filtrage de motifs génomiques et application sur l'architecture prototype R-disk
【24h】

Encodage linéaire d'automates pondérés: Filtrage de motifs génomiques et application sur l'architecture prototype R-disk

机译:加权自动机的线性编码:基因组模式的过滤及其在R盘原型体系结构上的应用

获取原文
获取原文并翻译 | 示例
           

摘要

We show that the lineal encoding scheme (or one-hot scheme) efficiently simulates weighted finite automata (WFA). Those automata carry weights on every transition and model substitution errors in proteic patterns. Automata with t transitions can be avantageously hardwired with O(t) operators. This scheme solves pattern matching problems by feeding a pipeline with one character every clock cycle. Such automata are well suited for use in FPGA devices, especially within the R-disk prototype, a hardware architecture devoted to content-based searches inside non-indexed large databanks: data is filtered on-the-fly at the output of storage devices, using distributed and reconfigurable processing elements. This improves the speed of parsing genomic databanks.%Les automates pondérés sont des automates avec des poids sur les transitions. En biologie, ils modélisent les erreurs de substitution utilisées dans les motifs représentant des domaines fonctionnels au sein des protéines. Nous montrons que l'encodage linéaire (one-hot) permet de simuler efficacement les automates finis ainsi que les automates pondérés, grâce au parallélisme massif de solutions matérielles comme celui des circuits reconfigurables FPGA. On peut matérialiser des automates à t transitions au moyen de O(t) opérateurs matériels et résoudre des problèmes de recherche de motifs de manière pipelinée en acceptant un caractère par cycle. L'encodage linéaire des automates pondérés a été implémenté sur R-disk, une architecture spécialisée offrant des traitements à la volée à la sortie de dispositifs de stockage pour la recherche par le contenu sur de grandes banques de données peu structurées : on obtient des traitements nouveaux et accélérés pour l'interrogation de banques de données génomiques.
机译:我们证明了线性编码方案(或单热点方案)有效地模拟了加权有限自动机(WFA)。这些自动机在每次转换时都具有权重,并且在蛋白质模式中具有模型替换错误。具有t转换的自动机可以与O(t)运算符进行硬连接。该方案通过在每个时钟周期为流水线提供一个字符来解决模式匹配问题。这种自动机非常适合在FPGA设备中使用,特别是在R盘原型中,R磁盘原型是一种硬件架构,致力于在无索引的大型数据库中进行基于内容的搜索:数据在存储设备的输出中进行实时过滤,使用分布式和可重新配置的处理元素。这提高了解析基因组数据库的速度。%Les使过渡过程自动化,使过程自动化。在生物学上,它替代了实用程序,但在实用程序上代表了域名或域名的保护。自动化的整体式仿真程序可以使仿真器自动化,同时也可以自动解决方案中可并行处理FPGA的大规模并行解决方案FPGA的可重配置性。在自动化的peutématérialiser上,自动化和自动化的过渡过程都可以通过自动化或自动化的方式完成。 L'encodagelinéairedes使R盘实现自动实施,并特别分配了建筑材料的优先购买权,并在建筑业中保留了永久保留权。新政法典审讯。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号