首页> 中国专利> 基于影像学表型的全基因组关联分析方法、介质及设备

基于影像学表型的全基因组关联分析方法、介质及设备

摘要

本发明涉及一种基于影像学表型的全基因组关联分析方法、介质及设备,所述方法包括以下步骤:获取脑部的多模态磁共振图像;对所述多模态磁共振图像进行预处理,获取相关皮层特征和白质纤维束弥散特征,形成影像学表型文件;获取与所述多模态磁共振图像对应的原始基因数据,并对所述原始基因数据进行筛选处理,获得有效基因数据,形成基因文件;采用加性遗传回归模型,基于所述影像学表型文件和基因文件进行关联分析,获得关联结果;对所述关联结果进行可视化处理。与现有技术相比,本发明具有分析准确度高等优点。

著录项

  • 公开/公告号CN113380379B

    专利类型发明专利

  • 公开/公告日2023.04.28

    原文格式PDF

  • 申请/专利权人 上海健康医学院;

    申请/专利号CN202110635565.7

  • 发明设计人 姚旭峰;吕玉婷;韩立婷;任哲;

    申请日2021.06.08

  • 分类号G16H30/20(2018.01);G06F17/18(2006.01);

  • 代理机构上海科盛知识产权代理有限公司 31225;

  • 代理人翁惠瑜

  • 地址 201318 上海市浦东新区周祝公路279号

  • 入库时间 2023-06-01 21:35:27

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-04-28

    授权

    发明专利权授予

说明书

技术领域

本发明计算机医学技术领域,涉及一种图像处理方法,尤其是涉及一种基于影像学表型的全基因组关联分析方法、介质及设备。

背景技术

阿尔茨海默病(Alzheimer’s Disease,AD)是一种病因未明的进行性神经系统退行性疾病,也是最常见的痴呆类型,约占全部痴呆患者的50%-70%,其致病原因迄今尚未明确,且无有效药物治愈或改变其病理进程的治疗方案。近年来其发病率呈显著增加趋势,给社会和家庭带来了严重问题。目前,全球AD患者已达两千万以上,预计到2050年,全世界痴呆症患者的数量将达到1.315亿。

研究已经证实AD是具有高度遗传性的疾病,影像基因组学这一新兴技术在AD的研究中取得较大进展,通过将多模态脑影像表型与基因数据结合分析,使用影像内表型来检测遗传变异或评估先前确定的遗传风险对大脑的影响,比单纯的基因研究更有效。目前,依据所选影像学表型以及基因数据的差别,产生了多样的影像基因组学的关联分析方法,尤其在AD的研究中,以全基因关联分析(Genome-Wide Association Study,GWAS)为代表,其已经成功的确定了多个关于AD的易感基因。

目前国内外关于AD的GWAS研究仍存在不足,其表现在影像学表型的选择仍多集中在大脑灰质皮层的变化,准确性不够。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种分析准确度高的基于影像学表型的全基因组关联分析方法、介质及设备。

本发明的目的可以通过以下技术方案来实现:

一种基于影像学表型的全基因组关联分析方法,包括以下步骤:

获取脑部的多模态磁共振图像;

对所述多模态磁共振图像进行预处理,获取相关皮层特征和白质纤维束弥散特征,形成影像学表型文件;

获取与所述多模态磁共振图像对应的原始基因数据,并对所述原始基因数据进行筛选处理,获得有效基因数据,形成基因文件;

采用加性遗传回归模型,基于所述影像学表型文件和基因文件,结合协变量文件进行关联分析,获得关联结果;

对所述关联结果进行可视化处理。

进一步地,所述多模态磁共振图像包括MR-T1图像和DTI图像,对不同模态的图像采用不同的预处理方案。

进一步地,所述相关皮层特征包括厚度、体积、表面积和曲率。

进一步地,所述白质纤维束弥散特征包括弥散特征各向异性、平均扩散系数、轴向弥散系数和径向弥散系数。

进一步地,通过所述筛选处理对所述原始基因数据进行质量控制,保留满足基因特征质量指标的基因数据,获得所述有效基因数据。

进一步地,所述基因特征包括基因分型率、基因缺失率、哈温伯格平衡、连锁不平衡、最小等位基因频率、PCA分层检测和性别检测。

进一步地,在获得所述关联结果后,利用FDR进行多重假设检验校正。

进一步地,所述可视化处理包括有关联意义基因的相关功能注释和所涉及的通路可视化。

本发明还提供一种计算机可读存储介质,包括供电子设备的一个或多个处理器执行的一个或多个程序,所述一个或多个程序包括用于执行如上所述基于影像学表型的全基因组关联分析方法的指令。

本发明还提供一种电子设备,包括:

一个或多个处理器;

存储器;和

被存储在存储器中的一个或多个程序,所述一个或多个程序包括用于执行如上所述基于影像学表型的全基因组关联分析方法的指令。

与现有技术相比,本发明具有以下有益效果:

1、本发明在进行全基因组关联分析方法时利用影像学特征作为中间表型,从基因层面解释大脑改变,可靠性更高,可以更好地揭示AD的病理学变化以及生理机制。

2、本发明对对不同模态的图像采用不同的预处理方案,能够对图像进行更加准确的处理,以利于后续分析。

3、本发明对原始基因数据进行样本个体层面和基因型层面的质量控制,消除人口分层等不利因素的影响,提高分析准确度。

附图说明

图1为本发明的流程示意图;

图2为MR-T1图像的预处理流程;

图3为DTI图像的预处理流程。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。

如图1所示,本实施例提供一种基于影像学表型的全基因组关联分析方法,包括以下步骤:

获取脑部的多模态磁共振图像,对所述多模态磁共振图像进行预处理,获取相关皮层特征和白质纤维束弥散特征,形成影像学表型文件;

获取与所述多模态磁共振图像对应的原始基因数据,并对所述原始基因数据进行筛选处理,获得有效基因数据,形成基因文件;

采用加性遗传回归模型,基于所述影像学表型文件和基因文件,结合协变量文件进行关联分析,获得关联结果,对所述关联结果进行可视化处理。

本实施例所提供的全基因组关联分析方法是一种基于影像学表型的阿尔茨海默病全基因组关联分析方法,所获得的多模态磁共振图像和原始基因数据为具有阿尔茨海默病的患者数据和正常数据。

一、多模态磁共振图像的预处理

对不同模态的图像处理不同的预处理方案:

(1)MR-T1图像:处理流程在Freesurfer软件上完成,如图2所示,主要步骤包括:首先去除颅骨等非脑组织结构,进行不均匀场校正,并与软件自带的脑模版进行配准,然后对大脑组织进行分割和膨胀填充,对整个大脑皮层进行三维重建,最后通过自带的脑模版对脑区进行标记,并提取各个脑区皮层特征,包括厚度、体积、表面积和曲率等。

(2)DTI图像:处理流程在MATLAB的软件包PANDA中完成,如图3所示,主要步骤包括:首先对图像进行头部校正和涡流畸变使用涡流校正,非脑组织使用大脑提取工具去除,接着对大脑提取图像进行目视检查,以确认非脑组织的准确移除;然后将弥散特征各向异性(Fractional Anisotropy,FA)、平均扩散系数(Mean Diffusivity,MD)、轴向弥散系数(Axial Diffusivity,DA)和径向弥散系数(Radial Diffusivity,DR)等弥散参数图像配准到标准模板(FMRIB58_FA)中,创建平均FA图像在其阈值大于0.2时的平均FA骨架。每个FA图像被投影到平均FA骨架上。随后,使用纤维示踪空间统计分析(Tract-Based SpatialStatistics,TBSS)重复测量弥散参数MD、DA和DR进行体素统计分析;最后选择默认分区图谱为JHU白质分区图谱进行脑区纤维束弥散特征的提取。

在得到这些表型数据后,应用SPSS21.0统计分析软件对各参数进行正态分布及方差齐性检验,并使用单因素方差分析进行显著性差异检测,结果以P<0.05为差异有统计学意义,最终得到用于全基因关联分析的相关皮层特征和白质纤维束弥散特征。

本实施例中,作为全基因组关联分析的数量特征(单因素方差分析P<0.05)共36个:

1)灰质皮层特征:左侧嗅皮层厚度、右侧嗅皮层厚度、左侧颞上回厚度、右侧颞上回厚度、左侧颞中回厚度、右侧颞中回厚度、左侧楔前叶厚度、右侧楔前叶厚度、左侧颞下回厚度、右侧梭状回厚度、左侧缘上回厚度、右侧扣带回峡部厚度、左侧颞中回体积、左侧嗅皮层。

2)白质纤维束弥散特征:穹窿FA值、左扣带回FA值、终纹FA值、内侧丘系MD值、左外囊MD值、扣带回MD值、终纹MD值、上额枕束MD值、钩束MD值、右毯MD值、内侧丘系DR值、左外囊DR值、扣带回DR值、终纹DR值、上额枕束DR值、钩束DR值、右毯DR值、右内侧丘系DA值、扣带回DA值、终纹DA值、上额枕束DA值和钩束DA值。

二、基因数据的处理

在获得原始基因数据后,通过所述筛选处理对所述原始基因数据进行质量控制,保留满足基因特征质量指标的基因数据,获得有效基因数据。基因特征包括基因分型率、基因缺失率、哈温伯格平衡、连锁不平衡、最小等位基因频率、PCA分层检测和性别检测。

基因数据的处理主要分为两部分:样本个体层面和基因型层面的质量控制。在样本方面,首先对基因数据进行标准化处理,并使用PCA进行人群的分层统计,并取前10个聚类结果作为无关变量参与到关联分析中,以消除人口分层的影响;然后使用性别检测来去除样本采集时的标记性别与基因型检测出来的性别不一致的样本。基因型层面的质量控制主要包括:(1)基因分型率的检测,阈值设定为99%,低基因检出率的SNP应在下一步分析中被删除;(2)基因型缺失率的检测,将阈值设置为5%,缺失率大于5%的SNPs被删除;(3)哈温伯格平衡指在理想状态下,各等位基因和等位基因的基因型频率在遗传中是稳定不变的,即保持着基因平衡。P值小于0.05的被认为不符合哈温伯格平衡,在GWAS分析中经常将阈值设置为10

三、全基因组关联分析研究

将样本性别、年龄、受教育程度以及APOEε4的携带数目等作为协变量(协变量文件),采用加性遗传回归模型将基因文件、表型文件与协变量文件进行关联分析,结果以P<10

四、实验结果的功能注释和可视化

首先,利用Locus Zoom在线工具(http://locuszoom.org/)对找到的有意义的位点进行相邻区域(上下游400kb)SNPs的显示以及其周围基因信息的可视化。然后,对有显著性意义的位点的基因型与表型之间的相互关系进行了分析。最后,将有意义的位点所在基因使用DAVID在线工具进行细胞成分、分子功能和生物过程三个方面的GO注释和KEGG通路分析,以阐述有关联意义基因的相关功能和所涉及的通路。

上述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号