首页> 中文学位 >基于单细胞测序数据的细胞亚型发现研究
【6h】

基于单细胞测序数据的细胞亚型发现研究

代理获取

目录

声明

摘要

第一章 绪论

1.1.1 研究背景

1.1.2 研究意义

1.2 单细胞聚类研究现状

1.3 本文的贡献与创新点

第二章 相关基础

2.1 第三代测序

2.2 聚类算法

2.2.1 传统聚类算法

2.2.2 网络基本概念

2.2.3 网络聚类算法

2.3 本文相关网络模型

2.3.1 snn-clique模型

2.3.2 clusterone模型

第三章 基于SNN的内聚力模型

3.1.1 模型简述

3.1.2 算法流程

3.2 内聚力和clique性能对比

3.2.1 网络整体连接性

3.2.2 时间效率

第四章 实验数据分析

4.1.1 内部聚类评价

4.1.2 外部评价指标

4.2 数据预处理

4.3 模拟实验

4.3.1 模拟数据一

4.3.2 数据一结果分析

4.3.3 模拟数据二

4.3.4 数据二结果分析

4.4 真实实验

4.4.1 真实数据

4.4.2 真实数据结果分析

第五章 总结

参考文献

致谢

展开▼

摘要

随着单细胞测序技术的进步,已经有越来越多单细胞层面的转录数据。借助这些单细胞数据我们可以深入了解细胞异质性和细胞层面的潜在机制。但数据的复杂性给我们带来众多挑战。对于细胞识别、聚类和功能发现可以通过特殊的转录信号在单分子层面得到很好的认识。最常用的方法是根据基因表达水平,判断同属于一类型的细胞,此类研究基于一个生物学假设即:基因表达水平决定其功能蛋白的合成,相似的基因表达水平有可能合成相似的功能蛋白。由此可见,对单细胞数据进行聚类具有十分重要的医学意义。
  目前针对单细胞数据聚类问题,已经提出了一些方法,比如pcaReduce生成层次模型、t-SNE非线性降维、考虑dropout影响的ZIFA模型、考虑稀有类型的RaceID模型、网络聚类snn-clique模型等等。尽管上述论文已经从不同方面解决聚类问题,但众多论文都没有对低丰度基因进行筛选。已有论文证实低丰度基因将会提高数据的维度,而且对聚类结果有一定的影响。论文具体针对snn-clique模型中quasi-clique的筛选具有忽略网络整体连接性的问题。clusterone模型中可以通过引入对内部边和外部边综合考量的内聚力(cohesiveness),从而避免对整体和局部节点度考虑不平衡的研究。本篇论文根据上述两者的优缺点将snn邻接图和基于内聚力引导的搜索聚类算法clusterone结合一起,提出snn-clusterone模型。他可以自动确定数据的聚类数量,此外利用rank的思想避免高维数据聚类的不适情况,并且在一定程度上避免snn-clique在网络整体连接性的缺陷。通过模拟数据验证snn-clusterone具有高鲁棒性,在模拟数据的结果上的聚类结果此模型优于snn-clique,在真实数据中,发现在基于多种距离情况下,snn-clusterone的结果在多种聚类评价指标下都高于snn-clique,说明此模型通过基因筛选和从整体连接性考虑,可以得到更好的聚类效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号