首页> 外文期刊>電子情報通信学会技術研究報告 >Suffix arrayを用いた高速な配列相同性検索の改良とェピゲノム解析への対応
【24h】

Suffix arrayを用いた高速な配列相同性検索の改良とェピゲノム解析への対応

机译:使用后缀数组改进高速序列同源性搜索并支持表观基因组分析

获取原文
获取原文并翻译 | 示例
       

摘要

We developed the system for fast homology search using suffix array. However, next generation sequencers are improving gradually and become to produce larger data than previous sequencers. Thus, we have developed a new faster system. To accelerate search using suffix array, we store the results of searching patterns whose length is less than L_(hash) and use them as caches. In addition, we enhanced our system to map bisulfite reads for epigenomics.%我々は以前にsuffix arrayを用いた高速な相同性検索システムを提案したが,近年の次世代シークェンサーの進歩が目覚ましく,得られる配列データは増加しており,さらなる高速化が必要とされている.このため,本研究では従来システムの改良を試み,長さL_(hash)のすベての文字列のsuffix arrayの検索結果を予め計算しておき,これを保存しておく.そして,検索の際はL_(hash)文字目までの検索には保存しておいたものを読み出すことで高速化した.また,このシステムを用いてェピゲノム解析へも対応するために,バイサルファイト処理を行ったDNA断片配列のマッピングができるように改良を行った.
机译:我们开发了使用后缀数组进行快速同源性搜索的系统,但是,下一代定序器正在逐步改进,并且比以前的定序器产生更大的数据,因此,我们开发了一个新的更快的系统。长度小于L_(哈希)的搜索模式的结果,并将它们用作缓存。此外,我们还改进了系统,以将亚硫酸氢盐读数映射到表观基因组学。%我们先前已经开发了使用后缀数组的快速同源性搜索系统。尽管我们提出了建议,但近年来,下一代定序器已取得了显着进步,并且可获得的序列数据不断增加,因此需要进一步的加速。预计算(hash)所有字符串的后缀数组的搜索结果并保存,然后将其保存以供搜索,直到L_(hash)字符。该系统用于加快处理速度,并且为了支持使用该系统的表观基因组分析,进行了改进,以能够绘制亚硫酸氢盐处理的DNA片段序列。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号