首页> 外文期刊>電子情報通信学会技術研究報告 >近隣剪定法: 進化系統樹を利用した配列リサンプリングアルゴリズム
【24h】

近隣剪定法: 進化系統樹を利用した配列リサンプリングアルゴリズム

机译:邻域修剪方法:使用进化系统树的序列重采样算法

获取原文
获取原文并翻译 | 示例
       

摘要

Recently alarge number of nucleotide sequences of various pathogens are available in public databases. The growth of the datasets has resulted in an enormous increase in computational costs. Moreover, due to differences in surveillance activities, the number of sequences found in databases varies from one country to another and from year to year. Therefore it is important to study resampling methods to reduce the sampling oias. In this paper we propose a novel algorithm-called the closest-neighbor trimming method-that resamples a given number of sequences from alarge nucleotide sequence dataset. We compare the performance of the proposed algorithm with other algorithms by using the nucleotide sequences of human H3N2 influenza viruses.%近年,インフルエンザをはじめ様々な病原体の遗伝子情報が大量に蓄積されつつある.データセッ卜の増大に伴い,配列解析にかかる計算コストが急増している.また,疫学調査活動の差異により,データセットは調査地域や年代に関して大きなサンプリングバイアスを含む.本研究では,進化系統榭を利用してサンプリング密度の高い配列を適宜取り除くリサンプリングアルゴリズムを提案し,その性能を比較実験により評価する.
机译:最近,公共数据库中提供了多种病原体的核苷酸序列,数据集的增长导致计算成本的巨大增加。此外,由于监视活动的差异,数据库中发现的序列数量因国家而异。因此,研究重采样方法以减少采样率很重要。在本文中,我们提出了一种新算法,称为最邻近修整方法,该算法从大核苷酸序列中对给定数量的序列进行重采样。通过使用人类H3N2流感病毒的核苷酸序列,我们将该算法与其他算法的性能进行了比较。%近年来,已积累了包括流感在内的各种病原体的大量基因信息。结果,序列分析的计算成本急剧增加,并且由于流行病学调查活动的差异,该数据集包含有关调查区域和年龄的较大抽样偏差。我们提出了一种重采样算法,可以适当地去除密集序列,并通过比较实验评估其性能。

著录项

  • 来源
    《電子情報通信学会技術研究報告》 |2012年第108期|113-117|共5页
  • 作者单位

    良浜バイオ大学バイオサイエンス学部コンピュータバイオサイェンス学科;

    北海道大学人猷共通感染症リサーチセンター;

    北海道大学人猷共通感染症リサーチセンター;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 jpn
  • 中图分类
  • 关键词

  • 入库时间 2022-08-18 00:29:12

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号