肠道菌群与代谢综合症关系的大数据研究方法

摘要

目的:最近高通量测序技术已被越来越多地用于探索健康肠道微生物组成与肥胖及代谢综合症的关系.一系列科学报道支持指出肠道微生物组成可以作为糖尿病、心血管病等的早期检测和诊断的生物标志物.然而,这些报道的样本数量通常比较小,各自发现的与疾病相关的菌群特征也不尽相同,且数据成孤岛状态,相互间的整合、比对比较困难.本文的目标是开发新的大数据分析工具,整合不同报道中的数据,用大数据建立更准确的疾病肠道菌群预测模型,发现代谢综合症风险的方法及个性化健康管理方案。 方法:开发了一个可扩展的分布式数据库,Micro DB,可连接多个数据集之间的复杂的相互作用,促进肠道菌群组成、生物标志物及代谢综合症的相关联的研究。为了积累大数据,开发了一个计算机程式将科学报道中的肠道菌群数据进行处理,标准化后导入Microd DB。用无监督学习的计算方法,建立疾病的风险预测模型,揭示肠道菌群和疾病之间的关系。 结果:Mcro DB现含有上千个从文献中整理的样本数据,这些数据包括16S r RNA基因序列、实验描述、微生物种类、微生物功能和物种丰富度等。建立了随机森算法的疾病预测模型。模型对糖尿病风险的预测成功率达到89%,交叉验证的成功率为85%(leave-one-out10%)。发现了肠道菌群作为糖尿病病预测的标志物。 结论:Micro DB含有不同来源的16S r RNA测序及相关健康疾病数据,它允许便捷的数据比较及统计模型的建立。而随机森林可以用来开发建立为代谢综合症的早期检测的预测模型。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号