首页> 中国专利> 基于肠道微生物菌群结构的肠型分型方法、装置及介质

基于肠道微生物菌群结构的肠型分型方法、装置及介质

摘要

本申请涉及肠型分型技术领域,公开一种基于肠道微生物菌群结构的肠型分型方法,包括:获取肠道菌群测序数据;肠道菌群测序数据包括肠道菌群16s扩增子数据和宏基因组测序数据;对肠道菌群测序数据进行质控和物种注释分析,以得到样本肠道菌群的第一相对丰度信息;根据第一相对丰度信息及卡方验证方法进行筛选以得到肠道菌群特征数据;将肠道菌群特征数据输入预设肠型预测模型进行肠型预测。本申请对16s扩增子和宏基因组测序数据处理分析得到肠道菌群特征数据,并利用预设肠型预测模型进行肠道菌群分型以预测肠型,相比聚类方法,机器学习方法能够提高肠型鉴定的效率和准确性,可对单个和多个样本进行肠型鉴定,也不局限于单一来源的样本。

著录项

  • 公开/公告号CN115938484A

    专利类型发明专利

  • 公开/公告日2023-04-07

    原文格式PDF

  • 申请/专利号CN202211734062.6

  • 申请日2022-12-30

  • 分类号G16B30/00(2019.01);G16B40/00(2019.01);G16B50/00(2019.01);G06N20/00(2019.01);

  • 代理机构北京集佳知识产权代理有限公司 11227;

  • 代理人乔图

  • 地址 100176 北京市北京经济技术开发区荣华中路10号1幢A座1501-2(北京自贸试验区高端产业片区亦庄组团)

  • 入库时间 2023-06-19 19:13:14

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-04-25

    实质审查的生效 IPC(主分类):G16B30/00 专利申请号:2022117340626 申请日:20221230

    实质审查的生效

  • 2023-04-07

    公开

    发明专利申请公布

说明书

技术领域

本申请涉及肠型分型技术领域,特别是涉及一种基于肠道微生物菌群结构的肠型分型方法、装置及介质。

背景技术

近年来的肠道微生物研究已经广泛证明了个体间肠道微生物群落的差异及其健康状态相关性。在微生物组成上,人们对肠道微生物的认识从在门水平到现在的属种等分辨率更高的分类单元。但肠道微生物是不同微生物群落组成的连续统一体,构成极其复杂,因此确定肠道微生物群落结构及其背后的机制才可以更好地了解人体的健康或疾病状态。后续的肠型影响因素研究表明:肠型与性别、年龄、体重均无关,而与饮食习惯有关;药物及健康/疾病状态亦与菌群结构相关。因此,类似“肠型”的肠道菌群结构特征绘制可作为健康状态判定和治疗随访的有效辅助手段。

2011年,欧洲分子生物学实验室(EMBL)首次提出“肠型”概念,即基于菌落组成的无监督聚类,将受检个体进行分类,不同类别定义为特定的肠型。研究者从33例人类粪便样本中鉴定出三种肠型。这三种肠型都可以通过三个菌属之一的丰度变化来识别:拟杆菌属(肠型1)、普氏菌属(肠型2)和瘤胃球菌(肠型3),并且该研究在另外两个人群中(154个美国人和85个丹麦人)也发现了相同的现象。目前对肠型的鉴定方法主要为通过无监督聚类方法将受检人群分类,以此鉴定样本的肠型。通过聚类方法对肠型进行判断,往往对样本数量有一定的要求,肠型鉴定效率较低;由于样本量以及聚类簇数目的不确定性,算法稳健性打折扣;并且该方法适用于单一的测序数据来源,对多来源数据分型的结果稳定性不明。

因此,如何提高肠型鉴定的效率和准确性,并且既可对单个样本,又能对多个样本进行肠型鉴定,也不局限于单一来源的样本是本领域技术人员亟需要解决的问题。

发明内容

本申请的目的是提供一种基于肠道微生物菌群结构的肠型分型方法、装置及介质,用于提高肠型鉴定的效率和准确性,并且既可对单个样本,又能对多个样本进行肠型鉴定,也不局限于单一来源的样本。

为解决上述技术问题,本申请提供一种基于肠道微生物菌群结构的肠型分型方法,包括:

获取肠道菌群测序数据;所述肠道菌群测序数据包括肠道菌群16s扩增子数据和宏基因组测序数据;

对所述肠道菌群测序数据进行质控和物种注释分析,以得到样本肠道菌群的第一相对丰度信息;

根据所述第一相对丰度信息及卡方验证方法进行筛选以得到肠道菌群特征数据;

将所述肠道菌群特征数据输入预设肠型预测模型进行肠型预测。

可选的,若所述肠道菌群测序数据为所述宏基因组测序数据,所述对所述肠道菌群测序数据进行质控和物种注释分析,以得到样本肠道菌群的第一相对丰度信息,包括:

对所述宏基因组测序数据进行质控,以去除所述宏基因组测序数据的接头,并过滤所述宏基因组测序数据中的低质量碱基;

去除质控后的所述宏基因组测序数据中的宿主序列,以得到宏基因组DNA序列;

对所述宏基因组DNA序列进行物种注释;

对注释结果进行校正,得到肠道菌群的绝对丰度信息;

提取属级别的肠道菌群的所述绝对丰度信息并进行均一化,以得到肠道菌群的所述第一相对丰度信息。

可选的,若所述肠道菌群测序数据为所述肠道菌群16s扩增子数据,所述对所述肠道菌群测序数据进行质控和物种注释分析,以得到样本肠道菌群的第一相对丰度信息,包括:

若所述肠道菌群16s扩增子数据为双端测序数据,则合并双端序列文件,对合并后的序列文件去除引物并进行质控;

对质控后的所述序列文件进行去冗余和去嵌合体,聚类成操作分类单元;

通过与数据库进行比对,对所述操作分类单元进行物种注释,以得到肠道菌群的绝对丰度信息;

提取属级别的肠道菌群的所述绝对丰度信息并进行均一化,以得到肠道菌群的所述第一相对丰度信息。

可选的,所述根据所述第一相对丰度信息及卡方验证方法进行筛选以得到肠道菌群特征数据,包括:

利用sklearn python库中的卡方验证方法计算所述第一相对丰度信息与肠型的相关性,将相关性小于预设值的显著特征作为所述肠道菌群特征数据。

可选的,所述将所述肠道菌群特征数据输入预设肠型预测模型进行肠型预测之前,还包括:

选取粪便样本作为所述实验数据;

对所述实验数据进行质控和物种注释分析得到样本肠道菌群的第二相对丰度信息,并根据所述第二相对丰度信息及卡方验证方法筛选显著特征,以构建样本集;

将所述样本集按照预设比例随机分成训练集和测试集;

分别利用各机器学习算法对所述训练集进行训练,以构建各所述机器学习算法所对应的分类模型,并利用所述测试集验证每个所述分类模型的性能,将所述性能最佳的所述分类模型作为所述预设肠型预测模型。

可选的,所述利用所述测试集验证每个所述分类模型的性能,将所述性能最佳的所述分类模型作为所述预设肠型预测模型,包括:

利用测试集计算各所述分类模型的准确率;

将所述准确率最高的所述分类模型作为所述预设肠型预测模型。

可选的,所述利用所述测试集验证每个所述分类模型的性能,将所述性能最佳的所述分类模型作为所述预设肠型预测模型,包括:

利用测试集绘制各所述分类模型的AUROC图;

根据所述AUROC图比较各所述分类模型的效能,将所述效能最佳的所述分类模型作为所述预设肠型预测模型。

本申请还提供一种基于肠道微生物菌群结构的肠型分型装置,包括:

获取模块,用于获取肠道菌群测序数据;所述肠道菌群测序数据包括肠道菌群16s扩增子数据和宏基因组测序数据;

第一相对丰度信息确定模块,用于对所述肠道菌群测序数据进行质控和物种注释分析,以得到样本肠道菌群的第一相对丰度信息;

筛选模块,用于根据所述第一相对丰度信息及卡方验证方法进行筛选以得到肠道菌群特征数据;

预测模块,用于将所述肠道菌群特征数据输入预设肠型预测模型进行肠型预测。

本申请还一种基于肠道微生物菌群结构的肠型分型装置,包括存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序时实现所述的基于肠道微生物菌群结构的肠型分型方法的步骤。

本申请还一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述的基于肠道微生物菌群结构的肠型分型方法的步骤。

本申请所提供的一种基于肠道微生物菌群结构的肠型分型方法,包括:获取肠道菌群测序数据;肠道菌群测序数据包括肠道菌群16s扩增子数据和宏基因组测序数据;对肠道菌群测序数据进行质控和物种注释分析,以得到样本肠道菌群的第一相对丰度信息;根据第一相对丰度信息及卡方验证方法进行筛选以得到肠道菌群特征数据;将肠道菌群特征数据输入预设肠型预测模型进行肠型预测。本申请能够对16s扩增子数据和宏基因组测序数据进行处理和分析得到肠道菌群特征数据,并利用预设肠型预测模型进行肠道菌群的分型以预测肠型,相比聚类方法,机器学习方法能够提高肠型鉴定的效率和准确性,即可对单个样本,又能对多个样本进行肠型鉴定,也不局限于单一来源的样本。

本申请所提供的一种基于肠道微生物菌群结构的肠型分型装置及介质等有益效果与方法对应,效果如上。

附图说明

为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种基于肠道微生物菌群结构的肠型分型方法的流程图;

图2为本申请实施例提供的一种四个分类模型的AUROC图;

图3为本申请实施例提供的一种基于肠道微生物菌群结构的肠型分型装置的结构图;

图4为本申请实施例提供的另一种基于肠道微生物菌群结构的肠型分型装置的结构图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本申请保护范围。

本申请的核心是提供一种基于肠道微生物菌群结构的肠型分型方法、装置及介质。

为了使本技术领域的人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。

图1为本申请实施例提供的一种基于肠道微生物菌群结构的肠型分型方法的流程图,如图1所示,肠型分型方法包括:

S10:获取肠道菌群测序数据;肠道菌群测序数据包括肠道菌群16s扩增子数据和宏基因组测序数据。

S11:对肠道菌群测序数据进行质控和物种注释分析,以得到样本肠道菌群的第一相对丰度信息。

若肠道菌群测序数据为宏基因组测序数据,对肠道菌群测序数据进行质控和物种注释分析,以得到样本肠道菌群的第一相对丰度信息,包括:对宏基因组测序数据进行质控,以去除宏基因组测序数据的接头,并过滤宏基因组测序数据中的低质量碱基;去除质控后的宏基因组测序数据中的宿主序列,以得到宏基因组DNA序列;对宏基因组DNA序列进行物种注释;对注释结果进行校正,得到肠道菌群的绝对丰度信息;提取属级别的肠道菌群的绝对丰度信息并进行均一化,以得到肠道菌群的第一相对丰度信息。

具体步骤如下:对待分型样本的宏基因组数据进行质控,使用fastp软件自动查找并去除宏基因数据的接头以及对低质量碱基进行过滤;使用kneaddata软件去除宿主序列;使用kraken2软件对质控和去宿主后的宏基因组DNA序列进行物种注释;使用bracken对kraken2注释结果进行校正,得到肠道菌群的绝对丰度信息;提取属级别的肠道菌群的绝对丰度信息并进行均一化,得到肠道菌群的第一相对丰度信息。

若肠道菌群测序数据为肠道菌群16s扩增子数据,对肠道菌群测序数据进行质控和物种注释分析,以得到样本肠道菌群的第一相对丰度信息,包括:若肠道菌群16s扩增子数据为双端测序数据,则合并双端序列文件,对合并后的序列文件去除引物并进行质控;对质控后的序列文件进行去冗余和去嵌合体,以聚类成操作分类单元;通过与数据库进行比对,对操作分类单元进行物种注释,以得到肠道菌群的绝对丰度信息;提取属级别的肠道菌群的绝对丰度信息并进行均一化,以得到肠道菌群的第一相对丰度信息。

具体步骤如下:数据预处理,如果待分型样本的16s扩增子数据是双端测序数据,则合并双端序列文件,然后对序列文件去除引物并质控(过滤低质量reads与切除末端低质量碱基);OTU聚类,对质控后的序列文件进行去冗余、去嵌合体、聚类成操作分类单元(Operational Taxonomic Units,OTU);物种注释,通过与数据库进行比对,对OTU进行物种注释,获取肠道菌群的绝对丰度信息;提取属级别的肠道菌群的绝对丰度信息并进行均一化,以得到肠道菌群的第一相对丰度信息。

S12:根据第一相对丰度信息及卡方验证方法进行筛选以得到肠道菌群特征数据。

利用sklearn python库中的卡方验证方法计算第一相对丰度信息与肠型的相关性,将相关性小于预设值的显著特征作为肠道菌群特征数据,可以是筛选P值小于0.05的显著特征作为肠道菌群特征数据。

S13:将肠道菌群特征数据输入预设肠型预测模型进行肠型预测。

本申请实施例中的对预设肠型预测模型的种类不作具体限定,预设肠型预测模型可以由逻辑回归、KNN、随机森林和XGBoost等机器学习算法通过K折交叉验证法分别构建并优化得到的模型。

本申请实施例所提供的一种基于肠道微生物菌群结构的肠型分型方法,包括:获取肠道菌群测序数据;肠道菌群测序数据包括肠道菌群16s扩增子数据和宏基因组测序数据;对肠道菌群测序数据进行质控和物种注释分析,以得到样本肠道菌群的第一相对丰度信息;根据第一相对丰度信息及卡方验证方法进行筛选以得到肠道菌群特征数据;将肠道菌群特征数据输入预设肠型预测模型进行肠型预测。本申请能够对16s扩增子数据和宏基因组测序数据进行处理和分析得到肠道菌群特征数据,并利用预设肠型预测模型进行肠道菌群的分型以预测肠型,相比聚类方法,机器学习方法能够提高肠型鉴定的效率和准确性,即可对单个样本,又能对多个样本进行肠型鉴定,也不局限于单一来源的样本。其次,本申请的流程部署简单,使用操作方便,只需部署相关计算节点即可完成全流程分析。

基于上述实施例,本申请实施例将肠道菌群特征数据输入预设肠型预测模型进行肠型预测之前,还包括:选取粪便样本作为所述实验数据;对实验数据进行质控和物种注释分析得到样本肠道菌群的第二相对丰度信息,并根据第二相对丰度信息及卡方验证方法筛选显著特征,以构建样本集;将样本集按照预设比例随机分成训练集和测试集;分别利用各机器学习算法对训练集进行训练,以构建各机器学习算法所对应的分类模型,并利用测试集验证每个分类模型的性能,将性能最佳的分类模型作为预设肠型预测模型。

为方便理解,下面举例说明。选取425例(184例健康人和241例自闭症患者)粪便样本作为实验数据,对实验数据进行质控和物种注释分析得到样本肠道菌群的第二相对丰度信息;使用sklearn python库中卡方验证方法(chi2)计算菌属的第二相对丰度信息与肠型的相关性,筛选出六个显著特征构建样本集,六个显著特征包括:布劳特氏属(Blautia)、柯林斯菌属(Collinsella)、双歧杆菌属(Bifidobacterium)、拟杆菌属(Bacteroides)、Phocaeicola(phocaeicola是由拟杆菌属在2009年划分为拟杆菌目的一个新属)、普雷沃氏菌属(Prevotella);将425例样本按照3:1的比例随机分成训练集和测试集;分别使用逻辑回归(Logistics Regression)、KNN(K-Nearest Neighbor)、随机森林(Random Forest)和XGBoost等四种机器学习算法通过K折交叉验证法分别构建并优化模型(用训练集构建分类模型,用测试集来验证分类模型的性能);将性能最佳的分类模型作为预设肠型预测模型。

基于上述实施例,本申请实施例利用测试集验证每个分类模型的性能,将性能最佳的所述分类模型作为预设肠型预测模型,包括:利用测试集计算各分类模型的准确率;将准确率最高的分类模型作为预设肠型预测模型。或者,利用测试集绘制各分类模型的AUROC图;根据AUROC图比较各分类模型的效能,将效能最佳的分类模型作为预设肠型预测模型。

具体的,引入准确率(Accuracy)、决定系数(R

表1为四个机器学习算法构建的分类模型的性能评估

基于表1可以看出Random Forest机器学习算法构建的分类模型的准确率最高,如图2所示,Random Forest机器学习算法构建的分类模型的AUC值最高。当然,其它机器学习算法构建的分类模型也可以作为预设肠型预测模型。

基于上述实施例,为方便理解,下面举例介绍利用预设肠型预测模型预测样本的肠型。

若待测样本为宏基因组测序数据,对宏基因组测序数据进行质控和物种注释分析,获取样本肠道菌群的相对丰度信息,具体参见上述实施例的质控和物种注释分析方法;从待检测样本的相对丰度信息中提取显著特征信息,构建肠型预测样本集;将样本集输入到预设肠型预测模型得到肠型预测结果。当然,本申请实施例的待测样本可以为自闭症患者粪便样本数据、健康人粪便样本数据和其他患者粪便样本数据。并不局限于使用宏基因组数据,也可以选择16s扩增子数据。

在上述实施例中,对于基于肠道微生物菌群结构的肠型分型方法进行了详细描述,本申请还提供基于肠道微生物菌群结构的肠型分型装置对应的实施例。需要说明的是,本申请从两个角度对装置部分的实施例进行描述,一种是基于功能模块的角度,另一种是基于硬件的角度。

图3为本申请实施例提供的一种基于肠道微生物菌群结构的肠型分型装置的结构图,如图3所示,肠型分型装置包括:

获取模块10,用于获取肠道菌群测序数据;肠道菌群测序数据包括肠道菌群16s扩增子数据和宏基因组测序数据;

第一相对丰度信息确定模块11,用于对肠道菌群测序数据进行质控和物种注释分析,以得到样本肠道菌群的第一相对丰度信息;

筛选模块12,用于根据第一相对丰度信息及卡方验证方法进行筛选以得到肠道菌群特征数据;

预测模块13,用于将肠道菌群特征数据输入预设肠型预测模型进行肠型预测。

基于上述实施例,作为优选的实施例,第一相对丰度信息确定模块包括:

第一质控单元,用于对宏基因组测序数据进行质控,以去除宏基因组测序数据的接头,并过滤宏基因组测序数据中的低质量碱基;

第一去除单元,用于去除质控后的宏基因组测序数据中的宿主序列,以得到宏基因组DNA序列;

第一物种注释单元,用于对宏基因组DNA序列进行物种注释;

校正单元,用于对注释结果进行校正,得到肠道菌群的绝对丰度信息;

第一相对丰度信息确定单元,用于提取属级别的肠道菌群的绝对丰度信息并进行均一化,以得到肠道菌群的第一相对丰度信息。

基于上述实施例,作为优选的实施例,第一相对丰度信息确定模块包括:

第二质控单元,用于若肠道菌群16s扩增子数据为双端测序数据,则合并双端序列文件,对合并后的序列文件去除引物并进行质控;

第二去除单元,用于对质控后的序列文件进行去冗余和去嵌合体,聚类成操作分类单元;

第二物种注释单元,用于通过与数据库进行比对,对操作分类单元进行物种注释,以得到肠道菌群的绝对丰度信息;

第二相对丰度信息确定单元,用于提取属级别的肠道菌群的绝对丰度信息并进行均一化,以得到肠道菌群的第一相对丰度信息。

基于上述实施例,作为优选的实施例,筛选模块包括:

筛选单元,用于利用sklearn python库中的卡方验证方法计算第一相对丰度信息与肠型的相关性,将相关性小于预设值的显著特征作为肠道菌群特征数据。

基于上述实施例,作为优选的实施例,还包括:

选取模块,用于选取粪便样本作为所述实验数据;

构建模块,用于对实验数据进行质控和物种注释分析得到样本肠道菌群的第二相对丰度信息,并根据第二相对丰度信息及卡方验证方法筛选显著特征,以构建样本集;

划分模块,用于将样本集按照预设比例随机分成训练集和测试集;

预设肠型预测模型确定模块,用于分别利用各机器学习算法对训练集进行训练,以构建各机器学习算法所对应的分类模型,并利用测试集验证每个分类模型的性能,将性能最佳的分类模型作为预设肠型预测模型。

基于上述实施例,作为优选的实施例,预设肠型预测模型确定模块包括:

计算单元,用于利用测试集计算各分类模型的准确率;

第一预设肠型预测模型确定单元,用于将准确率最高的分类模型作为预设肠型预测模型。

基于上述实施例,作为优选的实施例,预设肠型预测模型确定模块包括:

绘制单元,用于利用测试集绘制各分类模型的AUROC图;

第二预设肠型预测模型确定单元,用于根据AUROC图比较各分类模型的效能,将效能最佳的分类模型作为预设肠型预测模型。

由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。

本申请实施例所提供的一种基于肠道微生物菌群结构的肠型分型装置,获取肠道菌群测序数据;肠道菌群测序数据包括肠道菌群16s扩增子数据和宏基因组测序数据;对肠道菌群测序数据进行质控和物种注释分析,以得到样本肠道菌群的第一相对丰度信息;根据第一相对丰度信息及卡方验证方法进行筛选以得到肠道菌群特征数据;将肠道菌群特征数据输入预设肠型预测模型进行肠型预测。本申请能够对16s扩增子数据和宏基因组测序数据进行处理和分析得到肠道菌群特征数据,并利用预设肠型预测模型进行肠道菌群的分型以预测肠型,相比聚类方法,机器学习方法能够提高肠型鉴定的效率和准确性,即可对单个样本,又能对多个样本进行肠型鉴定,也不局限于单一来源的样本。其次,本申请的流程部署简单,使用操作方便,只需部署相关计算节点即可完成全流程分析。

图4为本申请实施例提供的另一种基于肠道微生物菌群结构的肠型分型装置的结构图,如图4所示,基于肠道微生物菌群结构的肠型分型装置包括:存储器20,用于存储计算机程序;

处理器21,用于执行计算机程序时实现如上述实施例基于肠道微生物菌群结构的肠型分型方法的步骤。

本实施例提供的基于肠道微生物菌群结构的肠型分型装置可以包括但不限于智能手机、平板电脑、笔记本电脑或台式电脑等。

其中,处理器21可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器21可以采用数字信号处理器(Digital Signal Processor,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable LogicArray,PLA)中的至少一种硬件形式来实现。处理器21也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称中央处理器(CentralProcessing Unit,CPU);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器21可以集成有图像处理器(Graphics Processing Unit,GPU),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器21还可以包括人工智能(Artificial Intelligence,AI)处理器,该AI处理器用于处理有关机器学习的计算操作。

存储器20可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器20还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器20至少用于存储以下计算机程序201,其中,该计算机程序被处理器21加载并执行之后,能够实现前述任一实施例公开的基于肠道微生物菌群结构的肠型分型方法的相关步骤。另外,存储器20所存储的资源还可以包括操作系统202和数据203等,存储方式可以是短暂存储或者永久存储。其中,操作系统202可以包括Windows、Unix、Linux等。数据203可以包括但不限于肠道菌群16s扩增子数据和宏基因组测序数据等。

在一些实施例中,基于肠道微生物菌群结构的肠型分型装置还可包括有显示屏22、输入输出接口23、通信接口24、电源25以及通信总线26。

本领域技术人员可以理解,图4中示出的结构并不构成对基于肠道微生物菌群结构的肠型分型装置的限定,可以包括比图示更多或更少的组件。

本申请实施例提供的基于肠道微生物菌群结构的肠型分型装置,包括存储器和处理器,处理器在执行存储器存储的程序时,能够实现如下方法:获取肠道菌群测序数据;肠道菌群测序数据包括肠道菌群16s扩增子数据和宏基因组测序数据;对肠道菌群测序数据进行质控和物种注释分析,以得到样本肠道菌群的第一相对丰度信息;根据第一相对丰度信息及卡方验证方法进行筛选以得到肠道菌群特征数据;将肠道菌群特征数据输入预设肠型预测模型进行肠型预测。

最后,本申请还提供一种计算机可读存储介质对应的实施例。计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述方法实施例基于肠道微生物菌群结构的肠型分型方法中记载的步骤。

可以理解的是,如果上述实施例中的方法以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上对本申请所提供的一种基于肠道微生物菌群结构的肠型分型方法、装置及介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号