元基因组序列聚类算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

最近五到十年间，随着高通量测序技术的发展，生物研究领域产生了大量的基因组测序数据。其中很大一部分是对生物体内和自然环境中的微生物群落取样并测序而产生的元基因组数据。元基因组数据包含了整个微生物群落的基因组信息，可以用来阐释人类健康，自然进化和生态构成等方面的诸多问题。对元基因组数据的处理与分析正在成为一个全新的生物信息学研究领域。
　　由于元基因组数据混杂了来自多个物种的DNA片段数据，因此对这些片段的归类成为元基因组数据分析中最重要的问题之一。传统的元基因组序列归类方法大多只能处理已知微生物基因组序列片段的归类问题，但是绝大多数的元基因组数据包含来自未知微生物的基因组序列片段，因此需要一种有效的无监督方法来对这些数据进行归类。
　　本文提出了一种基于无监督聚类的元基因组序列归类方法，命名为MCluster。该方法使用k-mer特征提取方法和一种特征权重可变的的无监督聚类方法，可以有效地将来自不同微生物的DNA序列数据区分开来。与以往的有监督方法相比，该方法并不依赖于已知的基因组序列数据。实验结果表明，MCluster在模拟数据集和真实数据集上的表现都超过了已有的无监督聚类方法，可以作为元基因组研究的有利工具对元基因组测序数据进行聚类，以研究其物种组成和分布。

著录项

作者
廖瑞奇;
展开▼
作者单位

复旦大学;

展开▼
授予单位复旦大学;
学科计算机软件与理论
授予学位硕士
导师姓名周水庚;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类算法理论 ;
关键词
元基因组序列; 聚类算法; 数据处理; 特征提取; 无监督聚类;

相似文献

中文文献
外文文献
专利

1. 基于仿射聚类的宏基因组序列物种聚类 [J] . 聂鹏宇 ,潘玮华 ,徐云 . 计算机系统应用 . 2013 ,第011期
2. 基于奇异值分解法的二元矩阵聚类算法研究 [J] . 侯磊 ,刘培强 ,肖进杰 . 计算机安全 . 2014 ,第011期
3. 基于稀疏子空间聚类的文本谱聚类算法研究 [J] . 原虹 . 电子技术与软件工程 . 2020 ,第013期
4. 最优聚类个数和初始聚类中心点选取算法研究 [J] . 张素洁 ,赵怀慈 . 计算机应用研究 . 2017 ,第006期
5. ε1-距离聚类算法研究Ward聚类算法的推广 [J] . 姚宁宁 ,李倩男 . 信息系统工程 . 2016 ,第010期
6. 原子级有限元与连续介质有限元中的高效屈曲算法研究 [C] . 徐然 ,刘彬 . 北京力学会第14届学术年会 . 2008
7. 基因组序列物种聚类问题研究及DNA聚类的云计算实现 [A] . 聂鹏宇 . 2013

元基因组序列聚类算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅