首页> 美国卫生研究院文献>Proceedings of the National Academy of Sciences of the United States of America >A measure of the similarity of sets of sequences not requiring sequence alignment.
【2h】

A measure of the similarity of sets of sequences not requiring sequence alignment.

机译:不需要序列比对的序列集相似性的一种度量。

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Determination of first- and second-order Markov chain homogeneity of sets of nuclear eukaryotic DNA sequences, both coding and noncoding, finds similarities imperceptible to the standard Needleman-Wunsch base matching or dot-matrix algorithms. These measures of the similarities of the distributions of adjacent pairs or triplets are in agreement with accepted evolutionary-tree topologies. Hierarchical clustering of the distributions of doublets of 30 miscellaneous coding sequences gives clusters in reasonable agreement with accepted biological classifications. In addition to similarity by homology, there is also observed similarity of disparate genes in the same organism--for example, all three disparate yeast genes (two enzymes and actin) form a well-distinguished cluster.
机译:确定核真核DNA序列集的一阶和二阶马尔可夫链同质性(包括编码和非编码),发现标准Needleman-Wunsch基本匹配或点矩阵算法难以感知的相似性。相邻对或三元组的分布相似性的这些度量与公认的进化树拓扑一致。 30个其他编码序列的双峰分布的分层聚类给出了与公认的生物学分类合理一致的聚类。除了通过同源性进行相似性分析外,还可以观察到同一生物体中不同基因的相似性,例如,所有三个不同酵母基因(两种酶和肌动蛋白)都形成了一个很好区分的簇。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号