机译:使用子模块优化选择蛋白质序列数据集的非冗余代表性子集
Department of Genome SciencesUniversity of WashingtonSeattle Washington;
Department of Electrical EngineeringUniversity of WashingtonSeattle Washington;
Department of Genome SciencesUniversity of WashingtonSeattle Washington;
discrete optimization; diversity; protein sequence analysis; redundancy; representative subsets; submodular maximization;
机译:使用子模块优化选择蛋白质序列数据集的非冗余代表性子集
机译:NCBI参考序列(RefSeq):基因组,转录本和蛋白质的精选非冗余序列数据库
机译:NCBI参考序列(RefSeq):精心策划的基因组,转录本和蛋白质的非冗余序列数据库
机译:如何选择转录的良好训练 - 数据子集:序列的子模具主动选择
机译:次模块优化和数据处理。
机译:使用亚模优化选择蛋白质序列数据集的非冗余代表性子集
机译:图3:每个点表示具有PDB代码1pyl的核糖核酸酶蛋白的所有网站的替代率与PDB代码1pyl,其代表我们的数据集,并且由于其少量站点而使图形更容易解释。
机译:如何为转录选择一个好的训练数据子集:序列的子模块主动选择