首页> 中国专利> 疾病生物标志物的筛选分析方法、平台、服务器及系统

疾病生物标志物的筛选分析方法、平台、服务器及系统

摘要

本发明提出一种疾病生物标志物的筛选分析方法、平台、服务器和系统,其中疾病生物标志物的筛选分析方法包括:接收分析指令,该分析指令包括样本筛选条件和分析程序参数;根据样本筛选条件获取与样本筛选条件对应的待分析样本的临床信息,并根据待分析样本的临床信息获取相关联的生物信息;将待分析样本的临床信息、相关联的生物信息以及分析程序参数发送至服务器,以对待分析样本的临床信息和相关联的生物信息进行分析;接收服务器返回的分析结果,并对分析结果进行显著性检验;如果分析结果不显著,则重置筛选条件并再次分析直至分析结果显著得。该方法为基因组学研究方面提供一个联系临床信息和基因组信息的平台,有利于大样本量基因验证实验。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-07-21

    专利权人的姓名或者名称、地址的变更 IPC(主分类):G06F19/00 变更前: 变更后: 变更前: 变更后: 申请日:20140513

    专利权人的姓名或者名称、地址的变更

  • 2017-11-17

    授权

    授权

  • 2015-12-23

    实质审查的生效 IPC(主分类):G06F19/00 申请日:20140513

    实质审查的生效

  • 2015-11-25

    公开

    公开

说明书

技术领域

本发明涉及生物信息技术领域,特别涉及一种疾病生物标志物的筛选分析方法、平台、服务器以及系统。

背景技术

随着计算机技术的不断发展以及统计算法的不断优化,临床医学诊断数据和实验中不确定的含混数据已逐渐的通过概率论、统计和决策分析等方法进行分析和处理。特别是在HIS(HospitalInformationSystem,医院信息系统)和PACS(PictureArchivingandCommunicationSystems,影像归档和通信系统)的广泛使用后,这些方法更加有力地推动了临床诊断、治疗效率和效果的进步。现在电子病历、专家诊断决策系统、虚拟医院、远程医疗和医学教育等正在改变医学的传统模式,孕育着医疗理论和体制的新飞跃。医学临床信息库正与生物信息数据库结合起来,建立的以疾病为中心的医学生物信息临床信息库,具有更广阔和有价值的增长点。

目前,临床信息数据库主要以实验和临床观察为数据来源,主要包含大量的医学临床资料和数据,如人体正常值、心电图、脑电图、器官呈像、病理呈像、临床药物等。因而只能根据个体的表型信息与疾病的关系,而不能发现更进一步的基因与疾病的关系。此外,当前的临床信息数据库大多数是建立后在一定范围内使用,如在一家或者几家有合作关系的医院之间,但是难以在整个医疗系统中共享,不利于根据多样化的数据对疾病进行分析。因此,当前的临床信息数据库以及分析方法难以最大化的理由各种临床观察数据进行医疗分析,不利于临床诊断,从而导致治疗效率和效果难以提高。

发明内容

本发明旨在至少在一定程度上解决上述技术问题。

为此,本发明的第一方面的目的在于提出一种疾病生物标志物的筛选分析方法,该方法能够通过临床信息指导生物信息分组研究,同时以生物分析结果指导临床诊断,促进转化医学的发展。

本发明的第二方面的目的在于提出另一种疾病生物标志物的筛选分析方法。

本发明的第三方面的目的在于提出一种疾病生物标志物的筛选分析平台。

本发明的第四方面的目的在于提出一种服务器。

本发明的第五方面的目的在于提出一种疾病生物标志物的筛选分析系统。

为达上述目的,根据本发明第一方面实施例提出了一种疾病生物标志物的筛选分析方法,包括:a.接收分析指令,其中,所述分析指令包括样本筛选条件和分析程序参数;b.根据所述样本筛选条件获取与所述样本筛选条件对应的待分析样本的临床信息,并根据所述待分析样本的临床信息获取相关联的生物信息;c.将所述待分析样本的临床信息、所述相关联的生物信息以及所述分析程序参数发送至服务器,以通过所述服务器根据所述分析程序参数构建分析任务对所述待分析样本的临床信息和所述相关联的生物信息进行分析;d.接收所述服务器返回的分析结果,并对所述分析结果进行显著性检验;e.如果所述分析结果不显著,则重置样本筛选条件,并重复步骤b-d,直至所述分析结果显著。

在本发明的一个实施例中,所述临床信息存储于临床信息数据库中,所述生物信息存储于生物信息数据库中,其中,所述生物信息数据库以所述临床信息数据库的分组信息为索引文件,所述根据所述样本筛选条件获取与所述样本筛选条件对应的待分析样本的临床信息,并根据所述待分析样本的临床信息获取相关联的生物信息,具体包括:根据所述样本筛选条件查询所述临床信息数据库,并获取待分析样本的临床信息;根据所述临床信息查询所述生物信息数据库的索引文件,根据所述索引文件获取所述生物信息数据库中与所述临床信息相关联的生物信息。

在本发明的一个实施例中,该方法还包括以下任意一个或多个步骤:如果所述分析结果显著,则对所述分析结果、所述临床信息和/或所述生物信息进行统计分析,并对统计分析结果进行动态渲染以生成结果列表和/或统计图表;在所述接收分析指令之后,根据所述分析指令获取用户标识信息,并根据所述用户标识信息获取对应的用户权限,以根据所述用户权限查询所述临床信息数据库和所述生物信息数据库;如果所述临床信息数据库和/或所述生物信息数据库为加密数据库,则在查询所述临床信息数据库和/或所述生物信息数据库之前,发出输入密钥提示,并在接收到密钥时,根据所述密钥对所述临床信息数据库和/或所述生物信息数据库进行解密。

本发明第二方面实施例提出了另一种疾病生物标志物的筛选分析方法,包括:接收待分析样本的临床信息和生物信息以及分析程序参数,其中所述程序参数包括分析程序标识、分析算法标识以及接口参数;根据所述分析程序标识调用相应的分析程序,根据所述分析算法标识调用相应的分析算法,并根据所述接口参数、所述分析程序和所述分析算法建立分析任务;通过执行所述分析任务对所述待分析样本的临床信息和生物信息进行分析,并存储分析结果。

在本发明的一个实施例中,所述分析任务包括样本检测任务、生物信息检测任务、关联分析任务、显著性检验任务,所述通过执行所述分析任务对所述待分析样本的临床信息和生物信息进行分析具体包括:执行所述样本检测任务分析所述临床信息以对所述待分析样本进行检测;当所述待分析样本通过检测后,执行所述生物信息检测任务分析所述生物信息;当所述生物信息通过检测后,执行所述关联分析任务以获取生物标志物;通过执行所述显著性检验任务对所述生物标志物进行检验。

在本发明的一个实施例中,该方法还包括:在执行所述分析任务过程中,监控所述分析任务的执行状态,并实时记录执行日志;如果监控到异常状态,则发送异常提示和所述执行日志,以根据所述执行日志调整所述分析任务。

在本发明的一个实施例中,所述分析任务包括样本检测任务、生物信息检测任务、关联分析任务、显著性检验任务,所述通过执行所述分析任务对所述待分析样本的临床信息和生物信息进行分析具体包括:执行所述样本检测任务分析所述临床信息以对所述待分析样本进行检测;当所述待分析样本通过检测后,执行所述生物信息检测任务分析所述生物信息;当所述生物信息通过检测后,执行所述关联分析任务以获取生物标志物;通过执行所述显著性检验任务对所述生物标志物进行显著性检验。

在本发明的一个实施例中,还包括:在执行所述分析任务过程中,监控所述分析任务的执行状态,并实时记录执行日志;如果监控到异常状态,则发送异常提示和所述执行日志,以根据所述执行日志调整所述分析任务。

本发明第三方面实施例提出了一种疾病生物标志物的筛选分析平台,包括:第一接收模块,用于接收分析指令,其中,所述分析指令包括样本筛选条件和分析程序参数;查询模块,用于根据所述样本筛选条件获取与所述样本筛选条件对应的待分析样本的临床信息,并根据所述待分析样本的临床信息获取相关联的生物信息;发送模块,用于将所述待分析样本的临床信息、所述相关联的生物信息以及所述分析程序参数发送至服务器,以通过所述服务器根据所述分析程序参数构建分析任务对所述待分析样本的临床信息和所述相关联的生物信息进行分析;显著性检验模块,接收所述服务器返回的分析结果,并对所述分析结果进行显著性检验,如果所述分析结果不显著,则重置样本筛选条件,并重新查询所述临床信息数据库和所述生物信息数据库,以再次分析直至所述分析结果显著。

在本发明的一个实施例中,所述临床信息存储于临床信息数据库中,所述生物信息存储于生物信息数据库中,其中,所述生物信息数据库以所述临床信息数据库的分组信息为索引文件,所述查询模块具体用于:根据所述样本筛选条件查询所述临床信息数据库,并获取待分析样本的临床信息;根据所述临床信息查询所述生物信息数据库的索引文件,根据所述索引文件获取所述生物信息数据库中与所述临床信息相关联的生物信息。

在本发明的一个实施例中,该平台还包括以下任意一个或多个模块:统计分析模块,用于在所述分析结果显著时,对所述分析结果、所述临床信息和/或所述生物信息进行统计分析,并对统计分析结果进行动态渲染以生成结果列表和/或统计图表;获取模块,用于根据所述分析指令获取用户标识信息,并根据所述用户标识信息获取对应的用户权限,以根据所述用户权限查询所述临床信息数据库和所述生物信息数据库;密钥管理模块,用于在所述临床信息数据库和/或所述生物信息数据库为加密数据库时,发出输入密钥提示,并在接收到密钥时,根据所述密钥对所述临床信息数据库和/或所述生物信息数据库进行解密。

本发明第四方面实施例提出了一种服务器,包括:接收模块,用于接收待分析样本的临床信息和生物信息以及分析程序参数,其中所述程序参数包括分析程序标识、分析算法标识以及接口参数;任务管理模块,用于根据所述分析程序标识调用相应的分析程序,根据所述分析算法标识调用相应的分析算法,并根据所述接口参数、所述分析程序和所述分析算法建立分析任务;分析模块,用于通过执行所述分析任务对所述待分析样本的临床信息和生物信息进行分析,并存储分析结果。

在本发明的一个实施例中,所述分析任务包括样本检测任务、生物信息检测任务、关联分析任务、显著性检验任务,所述分析模块具体用于:执行所述样本检测任务分析所述临床信息以对所述待分析样本进行检测;在所述待分析样本通过检测后,执行所述生物信息检测任务分析所述生物信息;在所述生物信息通过检测后,执行所述关联分析任务以获取生物标志物;通过执行所述显著性检验任务对所述生物标志物进行显著性检验。

在本发明的一个实施例中,该服务器还包括:监控模块,用于在执行所述分析任务过程中,监控所述分析任务的执行状态,并实时记录执行日志;提示模块,用于在监控到异常状态时发送异常提示和所述执行日志;调整模块,用于根据所述执行日志调整所述分析任务。

本发明第五方面实施例提出了一种疾病生物标志物的筛选分析系统,包括:本发明第三方面实施例所述的疾病生物标志物的筛选分析平台;和本发明第四方面实施例所述的服务器。

本发明实施例的疾病生物标志物的筛选分析方法、平台、系统及服务器,根据分析指令从临床信息数据库和生物信息数据库中筛选相应的临床信息和生物信息,并发送至服务器自动进行分析,为科学家在疾病的基因发掘、基因验证等基因组学研究方面建立一个能够联系临床信息和基因组学分析的平台,更有利于实施大样本量基因验证实验。此外,还可移植应用到各种不同复杂疾病研究领域,应用范围广阔。

本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:

图1为根据本发明一个实施例的疾病生物标志物的筛选分析方法的流程图;

图2为根据本发明另一个实施例的疾病生物标志物的筛选分析方法的流程图;

图3a为根据本发明一个实施例的疾病年龄分布示意图;

图3b为根据本发明一个实施例的累积测序深度的碱基占总碱基数的百分比分布图;

图3c为根据本发明一个实施例的一条染色体的平均测序深度、中间测序深度和覆盖度的统计示意图;

图3d为根据本发明一个实施例的测序深度的目标碱基数目占总碱基数目的百分比分布图;

图4为根据本发明又一个实施例的疾病生物标志物的筛选分析方法的流程图;

图5为根据本发明一个实施例的疾病生物标志物的筛选分析平台的结构框图;

图6为根据本发明另一个实施例的疾病生物标志物的筛选分析平台的结构框图;

图7为根据本发明一个实施例的服务器的结构框图;

图8为根据本发明另一个实施例的服务器的结构框图;

图9为根据本发明一个实施例的疾病生物标志物的筛选分析系统结构框图;

图10为根据本发明一个实施例的数据库的关联方法的流程图;

图11为根据本发明一个实施例的临床信息的收集与管理示意图;

图12为根据本发明一个实施例的疾病生物标志物的筛选分析平台的系统架构图;

图13为根据本发明一个实施例的搜索引擎建立机制的示意图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。

在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。

在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

下面参考附图描述根据本发明实施例的疾病生物标志物的筛选分析方法、平台、服务器以及系统。

在本发明的实施例中,疾病生物标志物(biomarker)是一种生物状态的指示物,是指能够客观反映正常生物学进程、致病机制或对治疗干预的药理学改变的可测定或评估的特征性指标。生物标志物主要可包括易感基因、SNP位点、microRNA、蛋白质、小分子化合物等。

图1为根据本发明一个实施例的疾病生物标志物的筛选分析方法的流程图。

如图1所示,根据本发明实施例的疾病生物标志物的筛选分析方法,包括:

S101,接收分析指令,其中,分析指令包括样本筛选条件和分析程序参数。

在本发明的一个实施例中,客户端可通过浏览器类界面(如web页面)接收分析指令,其中,客户端可为PC(personalcomputer,个人计算机)或移动终端,其中,移动终端可以是智能手机、平板电脑、个人数字助理、电子书等具有各种操作系统的硬件设备。样本筛选条件为对临床性状进行描述的信息,疾病生物标志物的筛选分析平台可根据接收到的分析指令对应的疾病构建相应的样本筛选条件,例如,如果接收到对冠心病的分析指令,可构建样本筛选条件:“在2010年患冠心病,且急诊生化检验中血钾指标高于100的病人”。分析程序参数可为用于确定分析待分析样本所用到的分析算法、支持各个算法的分析程序(如SAS软件、R软件等)以及算法之间的接口参数。

S102,根据样本筛选条件获取与样本筛选条件对应的待分析样本的临床信息,并根据待分析样本的临床信息获取相关联的生物信息。

在本发明的实施例中,临床信息存储于临床信息数据库中,生物信息存储于生物信息数据库中,可预先建立临床信息数据库与生物信息数据库的关联关系,即建立临床生物信息关联数据库。其中,生物信息数据库以临床信息数据库的分组信息为索引文件,因而,临床生物信息关联数据通过该索引文件进行关联。在本发明的一个实施例中,临床生物信息关联数据库采用分布式部署方案,可与HIS(HospitalInformationSystem,医院信息系统)相连,根据在各个部署节点的数据更新情况,实时更新。临床生物信息关联数据库还可与样本管理系统相连,从而可通过网络资源,云技术及客户端访问,方便位于不同地点的生物学医学者研究和使用,其中,样本管理系统是一个对生物样本进行管理的WEB网页系统,该系统以医院的特定需求为前提进行开发。

在本发明的一个实施例中,可首先根据样本筛选条件查询临床信息数据库,并获取待分析样本的临床信息。然后根据待分析样本的临床信息查询生物信息数据库的索引文件,并根据索引文件获取生物信息数据库中与待分析样本的临床信息相关联的生物信息。

其中,临床信息为通过实验和临床观察得到的资料和数据,如人体正常值、心电图、脑电图、器官呈像、病理呈像、临床药物等。生物信息主要包括基因组信息、蛋白质组信息和代谢组学信息等。基因组信息可包括原始测序信息(碱基序列、碱基质量),比对结果(碱基序列比对到参考基因组上的位置,比对得分)等;蛋白质组信息和代谢组信息可包括通过质谱仪测得的蛋白质、小分子代谢物的数据信息等。

S103,将待分析样本的临床信息、相关联的生物信息以及分析程序参数发送至服务器,以通过服务器根据分析程序参数构建分析任务对待分析样本的临床信息和相关联的生物信息进行分析。

在本发明的实施例中,客户端可通过B/S结构(Browser/Server,浏览器/服务器结构)与服务器进行通信,从而使客户端不局限于个人电脑,其他具有通过B/S结构与服务器进行通信的终端也可使用本方法。

在本发明的实施例中,服务器中具有封装了生物分析算法和程序的神经网络系统。神经网络系统的核心是相关算法和软件,包括相关分析、回归分析、协方差分析、主成分分析和关联分析等。相关分析研究两个变量之间相关的方向和相关的密切程度,主要用于描述变量之间相关性的强度。回归分析主要是通过建立一个变量间相互关系模型,在给定某个或某些变量值的条件下,用于估计或预测其他变量值,即分析变量间的相互依存关系。协方差分析是将直线回归分析与方差分析联合起来的一种统计方法,常用语消除混杂因素的影响,以提高分析结果的可靠性。主成分分析是将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法,又称主分量分析。关联分析是指如果两个或多个事物之间存在一定的关联,那么其中一个事物就能通过其他事物进行预测。目的是为了挖掘隐藏在数据间的相互关系。如全基因组关联分析(GenomeWideAssociationStudies,GWAS)是一种检测特定物种中不同个体间的全部或大部分基因,从而了解不同个体间的基因变化有多大的一种方法。不同的变化带来不同的性状,如各种疾病的不同。

在本发明的一个实施例中,当服务器接收到待分析样本的临床信息和相关联的生物信息以及分析程序参数后,可根据分析算法标识调用相应的分析算法,并根据分析程序标识部署到相应的分析程序中,以及根据接口参数设置分析算法的输入输出接口,从而构建分析任务,对待分析样本的临床信息和相关联的生物信息进行分析以获取生物标志物。

S104,接收服务器返回的分析结果,并对分析结果进行显著性检验。

S105,如果分析结果不显著,则重置样本筛选条件,并重复步骤S102-S104,直至分析结果显著。

在本发明的一个实施例中,服务器返回的分析结果中包括与根据上述筛选条件对应的易感基因、SNP位点、microRNA、蛋白质、小分子化合物等数据,以及通过各种算法得到的信息,如样本的具体临床性状、分组情况,所有样本的基因型分布信息,对分组数据的主成分分析得到的样本分层情况,case/control模型的关联分析结果,以及对疾病关联显著信号的连锁分析结果等。这些信息为潜在的生物标志物。在根据临床信息对分析结果进行显著性检验中,如果分析结果显著(如显著性检验的P值<0.05或P值<0.01,本发明对具体的显著标准不做限定),则分析结果符合临床分组,得到了合理的科研结论;如分析结果不显著,则不符合临床分组信息,需要重新进行筛选分组并进行分析,例如加大样本容量等,进行循环比对,直到得到符合临床分组信息合理的分析结果,即可获得符合用户分析指令的疾病生物标志物。

本发明实施例的疾病生物标志物的筛选分析方法,根据分析指令中的样本筛选条件筛选相应的临床信息和相关联的生物信息,并发送至服务器自动进行分析,为科学家在疾病的基因发掘、基因验证等基因组学研究方面提供一个联系临床信息和基因组学分析的平台,更有利于实施大样本量基因验证实验。分析得到的疾病生物可从分子水平探讨发病机制,而且在准确、敏感地评价早期、低水平的损害方面有着独特的优势,可提供早期预警,很大程度上为临床医生提供了辅助诊断的依据。此外,还可移植应用到各种不同复杂疾病研究领域,应用范围广阔。

图2为根据本发明另一个实施例的疾病生物标志物的筛选分析方法。如图2所示,根据本发明实施例的疾病生物标志物的筛选分析方法包括:

S201,接收分析指令,其中,分析指令包括样本筛选条件和分析程序参数。

S202,根据分析指令获取用户标识信息,并根据用户标识信息获取对应的用户权限。

在本发明的一个实施例中,在接收到的分析指令中还包括用户标识信息,其中,用户标识信息为用户的位置标识,例如用户账号、用户名、用户ID等。不同的用户权限可访问生物信息关联数据库中不同的数据。

S203,发出输入密钥提示,并在接收到密钥时,根据密钥对临床信息数据库和/或生物信息数据库进行解密。

在本发明的一个实施例中,为了保证临床信息和生物信息的隐私及安全,可对临床信息数据库和/或生物信息数据库进行加密,对于这种加密数据库,则需要根据密钥对数据库进行解密后进行查询。

S204,根据样本筛选条件查询与用户权限对应的临床信息数据库和/或生物信息数据库,并获取与样本筛选条件对应的待分析样本的临床信息和相关联的生物信息。

S205,将待分析样本的临床信息和相关联的生物信息以及分析程序参数发送至服务器,以通过服务器根据分析程序参数构建分析任务对待分析样本的临床信息和相关联的生物信息进行分析。

S206,接收服务器返回的分析结果,并对分析结果进行显著性检验。

S207,如果分析结果不显著,则重置样本筛选条件,并重复步骤S204-S206,直至分析结果显著。

S208,如果分析结果显著,则获取疾病生物标志物,并对分析结果、临床信息和/或生物信息进行统计分析,并对统计分析结果进行动态渲染以生成结果列表和/或统计图表。

举例来说,可对分析结果、临床信息和/或生物信息分别进行统计分组、曲线拟合等分析,并根据分析结果生成相应的结果列表和/或统计图表。图3a-d为根据本发明实施例的统计图标的示意图。具体地,图3a为根据本发明一个实施例的疾病年龄分布示意图,如图3a所示,以10年为一个年龄段列出了1-100周岁中每个年龄段疾病患者的人数。图3b为根据本发明一个实施例的累积测序深度的碱基占总碱基数的百分比分布图,如图3b所示,其中,横坐标为测序深度值,纵坐标为大于某一测序深度的碱基数目总和占所有碱基数目的百分比。图3c为根据本发明一个实施例的一条染色体的平均测序深度、中间测序深度和覆盖度的统计示意图,其中,横坐标为染色体编号,左侧纵坐标为测序深度,右侧纵坐标为覆盖度百分比,Meandepth为平均测序深度数,即某一染色体上所有碱基测序深度的平均值,Mediandepth为中间测序深度,即某一染色体上碱基所有测序深度的中间值,Coverge为覆盖度,即测序获得的序列占整条染色体的比例。图3d为根据本发明一个实施例的测序深度的目标碱基数目占总碱基数目的百分比分布图,其中,横坐标为测序深度,纵坐标为该测序深度的目标碱基数目占所有碱基数目的百分比。

应当理解,在本发明的一个实施例中,步骤S202、S203、S207是可选的。

本发明实施例的疾病生物标志物的筛选分析方法,可对分析结果、临床信息和/或生物信息进行统计分析,以结果列表和/或统计图表展现数据,更加多样化,并且直观、方便。此外,可根据用户权限以及通过密钥查询临床信息数据库和/或生物信息数据库,从而能够防止临床信息和生物信息被盗取和泄露,保证了临床信息和生物信息的隐私及安全。

为了实现上述实施例,本发明还提出另一种疾病生物标志物的筛选分析方法。

图4为根据本发明又一个实施例的疾病生物标志物的筛选分析方法的流程图。如图4所示,本发明实施例的疾病生物标志物的筛选分析方法,包括:

S401,接收待分析样本的临床信息和生物信息以及分析程序参数,其中程序参数包括分析程序标识、分析算法标识以及接口参数。

在本发明的一个实施例中,客户端查询到待分析样本的临床信息和生物信息之后,服务器可接收客户端发送的待分析样本的临床信息和生物信息以及分析程序参数。

S402,根据分析程序标识调用相应的分析程序,根据分析算法标识调用相应的分析算法,并根据接口参数、分析程序和分析算法建立分析任务。

在本发明的一个实施例中,服务器中具有用于数据分析的神经网络系统。神经网络系统的核心是相关算法和软件,包括相关分析、回归分析、协方差分析、主成分分析和关联分析等。相关分析研究两个变量之间相关的方向和相关的密切程度,主要用于描述变量之间相关性的强度。回归分析主要是通过建立一个变量间相互关系模型,在给定某个或某些变量值的条件下,用于估计或预测其他变量值,即分析变量间的相互依存关系。协方差分析是将直线回归分析与方差分析联合起来的一种统计方法,常用语消除混杂因素的影响,以提高分析结果的可靠性。主成分分析是将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法,又称主分量分析。关联分析是指如果两个或多个事物之间存在一定的关联,那么其中一个事物就能通过其他事物进行预测。目的是为了挖掘隐藏在数据间的相互关系。如全基因组关联分析(GenomeWideAssociationStudies,GWAS)是一种检测特定物种中不同个体间的全部或大部分基因,从而了解不同个体间的基因变化有多大的一种方法。不同的变化带来不同的性状,如各种疾病的不同。

在本发明的实施例中,可预先根据大量的临床信息和生物信息训练升级网络系统,以保证神经网络系统的健壮性,从而保证分析结果的准确性。

在本发明的一个实施例中,当服务器接收到待分析样本的临床信息和生物信息以及分析程序参数后,可根据分析算法标识调用相应的分析算法,并根据分析程序标识部署到相应的分析程序中,以及根据接口参数设置分析算法的输入输出接口,从而构建分析任务,对待分析样本的临床信息和生物信息进行分析。以GWAS分析为例,分析任务包括样本检测任务、生物信息检测任务、关联分析任务、显著性检验任务。

S403,通过执行分析任务对待分析样本的临床信息和生物信息进行分析,并存储分析结果。

在本发明的一个实施例中,以GWAS分析为例,通过执行分析任务对待分析样本的临床信息和生物信息进行分析可具体包括:首先,执行样本检测任务分析临床信息以对待分析样本进行检测;当待分析样本通过检测后,执行生物信息检测任务分析生物信息;当生物信息通过检测后,执行关联分析任务以获取生物标志物;然后通过执行显著性检验任务对生物标志物进行显著性检验。进而,在将显著的分析结果存储至预设位置,以供客户端进行查看和/或进一步分析。

本发明实施例的疾病生物标志物的筛选分析方法,可根据接收到的临床信息和生物信息以及分析程序参数选择相应的程序和算法建立分析任务,并自动对接收到的临床信息和生物信息进行分析并存储分析结果,实现了分析过程的自动调度和执行,无需人为干预,方便简单。

在本发明的一个实施例中,为了在分析任务的执行过程中能够及时发现存在的问题,并确定问题原因,可在执行过程中记录执行日志,并对执行状态进行监控,从而能够快速高效的发现并解决问题,保证分析效率和分析结果的准确性。具体地,在执行分析任务过程中,监控分析任务的执行状态,并实时记录执行日志。如果监控到异常状态,则发送异常提示和执行日志,以根据执行日志调整分析任务。

在本发明的实施例中,在执行分析任务的过程中,还可输出过程中的中间结果至预设位置,以便于更准确的对分析结果进行全面的了解。

为了实现上述实施例,本发明还提出一种疾病生物标志物的筛选分析平台。

图5为根据本发明一个实施例的疾病生物标志物的筛选分析平台的结构框图。

如图5所示,根据本发明实施例的疾病生物标志物的筛选分析平台,包括:第一接收模块110、查询模块120、发送模块130和显著性检验模块140。

具体地,第一接收模块110用于接收分析指令,其中,分析指令包括样本筛选条件和分析程序参数。

查询模块120用于根据样本筛选条件获取与样本筛选条件对应的待分析样本的临床信息,并根据待分析样本的临床信息获取相关联的生物信息。在本发明的一个实施例中,临床信息存储于临床信息数据库中,生物信息存储于生物信息数据库中,可预先建立临床信息数据库与生物信息数据库的关联关系,即建立临床生物信息关联数据库。其中,生物信息数据库以临床信息数据库的分组信息为索引文件,因而,临床生物信息关联数据通过该索引文件进行关联。具体地,查询模块120可首先根据样本筛选条件查询临床信息数据库,并获取待分析样本的临床信息。然后根据待分析样本的临床信息查询生物信息数据库的索引文件,并根据索引文件获取生物信息数据库中与待分析样本的临床信息相关联的生物信息。

发送模块130用于将待分析样本的临床信息、相关联的生物信息以及分析程序参数发送至服务器,以通过服务器根据分析程序参数构建分析任务对待分析样本的临床信息和相关联的生物信息进行分析。

显著性检验模块140接收服务器返回的分析结果,并对分析结果进行显著性检验,如果分析结果不显著,则重置样本筛选条件,并重新查询临床信息数据库和生物信息数据库,以再次分析直至分析结果显著。

本发明实施例的疾病生物标志物的筛选分析平台,根据分析指令中的样本筛选条件筛选相应的临床信息和相关联的生物信息,并发送至服务器自动进行分析,为科学家在疾病的基因发掘、基因验证等基因组学研究方面提供一个联系临床信息和基因组学分析的平台,更有利于实施大样本量基因验证实验。此外,还可移植应用到各种不同复杂疾病研究领域,应用范围广阔。

图6为根据本发明另一个实施例的疾病生物标志物的筛选分析平台的结构框图。

如图6所示,根据本发明实施例的疾病生物标志物的筛选分析平台,包括:第一接收模块110、查询模块120、发送模块130、显著性检验模块140、统计分析模块150、获取模块160和密钥管理模块170。

具体地,统计分析模块150用于分析结果显著时,对分析结果、临床信息和/或生物信息进行统计分析,并对统计分析结果进行动态渲染以生成结果列表和/或统计图表。

获取模块160用于根据分析指令获取用户标识信息,并根据用户标识信息获取对应的用户权限,以根据用户权限查询临床信息数据库和/或生物信息数据库。在本发明的一个实施例中,在接收到的分析指令中还包括用户标识信息,其中,用户标识信息为用户的位置标识,例如用户账号、用户名、用户ID等。

密钥管理模块170用于在临床信息数据库和/或生物信息数据库为加密数据库时,发出输入密钥提示,并在接收到密钥时,根据密钥对临床信息数据库和/或生物信息数据库进行解密。在本发明的一个实施例中,为了保证临床信息和生物信息的隐私及安全,可对临床信息数据库和/或生物信息数据库进行加密,对于这种加密数据库,则需要密钥管理模块170根据密钥对数据库进行解密后进行查询。

本发明实施例的疾病生物标志物的筛选分析平台,可对分析结果、临床信息和/或生物信息进行统计分析,以结果列表和/或统计图表展现数据,更加多样化,并且直观、方便。此外,可根据用户权限以及通过密钥查询临床信息数据库和/或生物信息数据库,从而能够防止临床信息和生物信息被盗取和泄露,保证了临床信息和生物信息的隐私及安全。

为了实现上述实施例,本发明还提出一种服务器。

图7为根据本发明一个实施例的服务器的结构框图。

如图7所示,本发明实施例的服务器,包括:接收模块210、任务管理模块220和分析模块230。

具体地,接收模块210用于接收待分析样本的临床信息和生物信息以及分析程序参数,其中程序参数包括分析程序标识、分析算法标识以及接口参数。

任务管理模块220用于根据分析程序标识调用相应的分析程序,根据分析算法标识调用相应的分析算法,并根据接口参数、分析程序和分析算法建立分析任务。

分析模块230用于通过执行分析任务对待分析样本的临床信息和生物信息进行分析,并存储分析结果。在本发明的一个实施例中,分析任务可包括样本检测任务、生物信息检测任务、关联分析任务、显著性检验任务。更具体地,首先,执行样本检测任务分析临床信息以对待分析样本进行检测;当待分析样本通过检测后,执行生物信息检测任务分析生物信息;当生物信息通过检测后,执行关联分析任务以获取生物标志物;然后通过执行显著性检验任务对生物标志物进行显著性检验。进而,在将显著的分析结果存储至预设位置,以供客户端进行查看和/或进一步分析。

本发明实施例的服务器,可根据接收到的临床信息和生物信息以及分析程序参数选择相应的程序和算法建立分析任务,并自动对接收到的临床信息和生物信息进行分析并存储分析结果,实现了分析过程的自动调度和执行,无需人为干预,方便简单。

图8为根据本发明另一个实施例的服务器的结构框图。

如图8所示,本发明实施例的服务器,包括:接收模块210、任务管理模块220、分析模块230、监控模块240、提示模块250和调整模块260。

具体地,监控模块240用于在执行分析任务过程中,监控分析任务的执行状态,并实时记录执行日志。

提示模块250用于在监控到异常状态时发送异常提示和执行日志。

调整模块260用于根据执行日志调整分析任务。

本发明实施例的服务器,在分析任务的执行过程中记录执行日志,并对执行状态进行监控,从而能够及时发现问题,并确定问题原因,能够快速高效的解决问题,保证分析效率和分析结果的准确性。

为了实现上述实施例,本发明还提出一种疾病生物标志物的筛选分析系统。

图9为根据本发明一个实施例的疾病生物标志物的筛选分析系统结构框图。如图9所示,本发明实施例的疾病生物标志物的筛选分析系统,包括:本发明实施例的疾病生物标志物的筛选分析平台100和服务器200。

本发明实施例的疾病生物标志物的筛选分析系统,根据分析指令中的样本筛选条件筛选相应的临床信息和相关联的生物信息,并发送至服务器自动进行分析,为科学家在疾病的基因发掘、基因验证等基因组学研究方面建立一个能够联系临床信息和基因组学分析的平台,更有利于实施大样本量基因验证实验。此外,还可移植应用到各种不同复杂疾病研究领域,应用范围广阔。

在本发明的实施例中,临床生物信息关联数据库可通过将临床信息数据库和生物信息数据库进行关联获得。图10为根据本发明一个实施例的数据库的关联方法的流程图。如图10所示,本发明实施例的数据库的关联方法,包括:

S1001,实时采集多个样本的临床信息,并根据临床信息构建临床信息数据库。

在本发明的一个实施例中,临床信息数据库提供多个数据访问接口,其中,多个数据访问接口分别与多个操作系统相对应,每个数据访问接口用于接收具有相应的操作系统的客户端发送的临床信息。具体地,临床信息数据库可通过分布式部署与多个HIS系统或客户端相连,并分别为每个HIS系统或客户端提供适合的访问接口。进而通过WEB数据录入方式、或者数据库同步方式实时采集HIS系统中的临床信息,也可通过电子数据导入方式接收客户端提交的页面表单,以导入临床信息。

在本发明的一个实施例中,临床信息数据库同时涵盖WEB数据录入、数据录入表格的自动生成、电子数据导入、数据统计分析和报告输出、不良事件报告(在项目使用过程中会出现一些严重性或是一般性的错误,方便进行管理,通过此报告可以很方便的查看系统本身的问题并进行修正)、质量控制(项目管理中的用语,对项目本身来说是一套标准的控制管理流程)、标准化临床词汇的使用(对临床数据进行标准化、规范化,便于查询)、安全和隐私等方案,可适用于各种不同的临床领域,而不需要额外的编程工作。

在本发明的一个实施例中,为了能够建立一套可适配的数据库结构,以使疾病生物标志物的筛选分析平台能够针对不同类型的疾病和生物分析需求,临床信息数据库的数据结构中将各个对象的属性在字典表中进行统一的描述,同时对属性可能得取值范围和类型进行了划分。由此,如果需要适应不同研究对象,只需维护这个字典表和字典属性表即可,不需要对表结构做其他调整。其中,字典表和字典属性为对需要查询的属性进行控制管理的可控数据,是属性的查询条件的依据,可通过字典表和字典属性对临床信息数据库进行增、删、改、查。

S1002,获取多个样本的生物信息,根据生物信息建立生物信息数据库。

在本发明的一个实施例中,生物信息主要包括基因组信息、蛋白质组信息和代谢组学信息等。基因组信息可包括原始测序信息(碱基序列、碱基质量),比对结果(碱基序列比对到参考基因组上的位置,比对得分)等;蛋白质组信息和代谢组信息可包括通过质谱仪测得的蛋白质、小分子代谢物的数据信息等。

S1003,获取临床信息数据库的分组信息,并根据临床数据库的分组信息建立生物信息的索引信息。

在本发明的一个实施例中,临床信息数据库的分组信息为根据临床信息数据库的数据结构进行分组整理获取的分组信息。例如,根据年龄将1-100之间的个体分为10个年龄组。索引信息为临床信息数据库的分组信息的描述信息,如血钾指标高于100、患冠心病等。

S1004,将索引信息存储至生物信息数据库,并根据索引信息建立临床信息数据库与生物数据库的管理关系。

本发明实施例的数据库的关联方法,实现了生物信息数据库与临床信息数据的共享与关联,为疾病生物标志物的筛选分析和研究提供了数据支撑和决策支持,同时对临床复杂疾病的研究模式带来方法学上的革命性创新。

图11为根据本发明一个实施例的临床信息的收集与管理示意图。在本发明的一个实施例中,如图11所示,可通过疾病生物标志物的筛选分析分析平台检索、浏览临床信息数据库中的临床信息及临床分组信息(如根据检查时间、检测项目、诊断结果、病例、病人基本信息等进行分组后的临床分组信息),还可对临床信息进行分组统计。临床信息数据库可通过调用webservice接口或者通过数据库同步直接从HIS系统中导入临床信息,也可由用户通过页面表单提交临床信息。

图12为根据本发明一个实施例的疾病生物标志物的筛选分析平台的系统架构图,如图12所示,该疾病生物标志物的筛选分析平台的包括用户层(代表用户)、应用服务互联网层(基本的网络环境)、基本的业务系统(存储服务的一些硬件设备)、和业务服务平台中的基本功能模块(平台包括的基本业务支撑功能)、再到外部系统(第三方或是其它的系统接口等)。

图13为根据本发明一个实施例的搜索引擎建立机制的示意图。如图13所示,该搜索引擎建立机制包括两部分:第一部分是基本的信息管理,数据库中存储大量的医院系统中可分析的数据,或是有一些文件存储方式,这些数据的来源有可能是人工录入,有可能是自动化生成的,该系统供用户方便的检索、查询,对于一些复杂的检索需要计算机程序进行高效的处理,得到的结果一并参与检索。第二部分是对于一些数据文件或是搜索结果的索引,在这两种方式之上建立一套标准的索引机制,对于后续的分析、统计、查询能方便快捷高效的进行。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。

应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器,磁盘或光盘等。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同限定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号