首页> 中文期刊> 《西安交通大学学报》 >一种碱基精度的肿瘤基因组单体型异质性识别算法

一种碱基精度的肿瘤基因组单体型异质性识别算法

         

摘要

针对肿瘤组织的异质性的子克隆解析,提出了一种通过多级子克隆的体细胞突变模式来识别单体型异质性的算法.该算法基于肿瘤组织的多文库测序数据提取文库特征和双末端读段约束,通过对体细胞突变位点的等位基因变异频率进行聚类估算出子克隆数目的一个先验;同时设计了一种拼接识别算法,通过遍历位点对应的读段来拼接单体型序列,拼接出的单体型序列的精度为碱基水平;采用后验概率的最大似然估计解出子克隆的个数、配比及演化关系.仿真实验表明,当基础文库满足一定测序覆盖度时,该算法对单体型异质性的识别精度可达到99%以上,能够取代目前数据分析中常用的两步法,且获得高精确的识别结果.%An algorithm for identifying haplotype heterogeneity in cancer genomes is proposed to consider somatic mutational events carried by multiple sub-clones.The algorithm is based on the genomic sequencing data with multiple libraries of tumor tissue and extracts the features from both the multi-library and the constraints of paired-end reads.A priori number of sub-clones is roughly estimated by clustering the allelic variant frequency of each somatic loci.A contig-andextension algorithm is designed,and the haplotype sequences are assembled by traversing the reads mapping to the loci.Thus,the contigs present an identification resolution on base-pair level.The number and proportion of sub-clones and the evolution relationships among them are further estimated by maximizing the likelihood of the posterior probabilities.Simulation results show that the algorithm reaches 99 % in accuracy when the sequencing based library satisfies some coverage.The proposed algorithm outperforms the existing two-stage pipeline,which is widely used in data analysis now.

著录项

  • 来源
    《西安交通大学学报》 |2017年第6期|92-96|共5页
  • 作者单位

    锦州医科大学公共基础学院,121001,辽宁锦州;

    西安交通大学计算机科学与技术系,710049,西安;

    西安交通大学陕西省医疗健康大数据工程研究中心,710049,西安;

    西安交通大学计算机科学与技术系,710049,西安;

    西安交通大学陕西省医疗健康大数据工程研究中心,710049,西安;

    西安交通大学计算机科学与技术系,710049,西安;

    西安交通大学陕西省医疗健康大数据工程研究中心,710049,西安;

    西安交通大学计算机科学与技术系,710049,西安;

    西安交通大学陕西省医疗健康大数据工程研究中心,710049,西安;

    西安交通大学计算机科学与技术系,710049,西安;

    西安交通大学陕西省医疗健康大数据工程研究中心,710049,西安;

    西安交通大学陕西省医疗健康大数据工程研究中心,710049,西安;

    第四军医大学肿瘤生物学国家重点实验室,710032,西安;

    西安交通大学管理学院,710049,西安;

    西安交通大学陕西省医疗健康大数据工程研究中心,710049,西安;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 在其他方面的应用;
  • 关键词

    肿瘤异质性; 子克隆解析; 单体型异质性; 多文库测序数据; 拼接识别算法;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号