声明
摘要
第1章 绪论
1.1 研究背景及意义
1.2 研究现状
1.2.1 宏基因组序列物种聚类问题
1.2.2 DNA序列聚类问题
1.3 本文工作
1.4 论文组织
第2章 相关技术与知识
2.1 基因与DNA
2.2 基因组学的相关概念
2.2.1 下一代测序技术
2.2.2 宏基因组学
2.3 云计算在生物信息学中的应用
2.4 本章小结
第3章 宏基因组序列物种聚类问题研究
3.1 问题定义
3.2 已有工作介绍
3.2.1 有参考的物种分类算法
3.2.2 AbundanceBin——基于EM的物种聚类算法
3.2.3 TOSS——基于MCL图聚类的物种聚类算法
3.2.4 MetaCluster——基于k-means的物种聚类算法
3.3 基于仿射聚类的物种聚类算法
3.3.1 研究思路
3.3.2 基于相似度初步聚类
3.3.3 基于仿射聚类的进一步聚类
3.3.4 实验结果及性能分析
3.4 本章小结
第4章 DNA序列聚类算法的云计算实现
4.1 问题描述
4.2 已有相关工作介绍
4.2.1 cd-hit——基于贪心比对的DNA聚类算法
4.2.2 uclust——基于快速搜索的DNA聚类算法
4.3 基于MapReduce的DNA聚类
4.3.1 研究思路
4.3.2 基于MapReduce的DNA聚类
4.3.3 实验结果及性能评价
4.4 本章小结
第5章 总结
5.1 本文工作
5.2 本文贡献与创新之处
5.3 进一步工作
参考文献
附录1 插图索引
附录2 表格索引
致谢
在读期间发表的学术论文
攻读学位期间参加的科研项目