摘要
第一章 绪论
1.1 研究背景
1.1.1 元基因组简介
1.1.2 元基因组数据的产生与格式
1.1.3 元基因组归类
1.2 研究现状
1.2.1 基于序列相似度的方法
1.2.2 基于序列组成的方法
1.3 研究目的
1.4 研究内容
1.5 本文结构
第二章 方法
2.1 方法流程
2.2 数据预处理和特征集提取
2.3 特征降维方法
2.4 聚类方法描述
2.5 距离定义
2.6 聚类效果评价方法
第三章 实验结果
3.1 数据集
3.1.1 模拟数据集
3.1.2 真实数据集
3.2 参数优化及选择
3.2.1 k-mer特征提取中k的选择
3.2.2 聚类中距离量度的选择
3.2.3 使用非负矩阵分解进行特征降维的效果
3.3 模拟数据集上的实验结果
3.3.1 在均匀分布数据集上的实验结果
3.3.2 来自不同物种的数据具有不同比例时聚类结果的比较
3.3.3 元基因组中的序列数目对聚类结果的影响
3.4 在真实数据集上的实验结果
3.5 运行时间分析
第四章 总结与展望
参考文献
投稿论文
致谢
声明