首页> 中国专利> 脑功能连接相关值的调整方法、脑功能连接相关值的调整系统、脑活动分类器的协调方法、脑活动分类器的协调系统以及脑活动生物标记物系统

脑功能连接相关值的调整方法、脑功能连接相关值的调整系统、脑活动分类器的协调方法、脑活动分类器的协调系统以及脑活动生物标记物系统

摘要

用于协调从多个设施获取到的脑测量数据来实现利用脑功能图像法的判别处理的脑活动分类器的协调系统对于在多个测量地点处分别共同地成为测量对象的多个移动受验者,获取测量各移动受验者的预先决定的多个脑区域的脑活动而得到的结果的数据,对于各移动受验者计算脑功能连接阵列的规定的元素,该脑功能连接阵列表示一组多个脑区域的脑活动的时间相关性,通过使用一般线性混合模型法,针对脑功能连接阵列的每个规定的元素计算测定偏倚数据(3108)来作为各测量地点处的相对于多个测量地点和多个移动受验者的该元素的平均而言的固定效应,从而执行协调处理。

著录项

说明书

技术领域

本发明涉及一种对在多个装置中利用脑功能图像法测量出的脑功能连接相关值进行调整的技术、使用了脑功能图像法的脑活动分类器的协调方法、脑活动分类器的协调系统以及脑活动生物标记物系统。本申请基于2018年10月11日申请的日本申请第2018-192842号和2019年2月27日申请的日本申请第2019-034887号要求优先权,引用所述日本申请中所记载的全部的记载内容。

背景技术

(生物标记物)

将为了定量地掌握生物体内的生物学变化而对生物体信息进行了数值化/定量化的指标称为“生物标记物”。

FDA(美国食品药品监督管理局)将生物标记物的定位定义为“作为正常过程和病态过程、或者对于治疗的药理学反应的指标来客观地测定/评价的项目”。另外,用于表征疾病的状态和变化、治愈的程度的生物标记物被用作用于确认新药在临床试验中的有效性的替代标记物(surrogate marker)。血糖值及胆固醇值等是代表性的作为生活习惯病的指标的生物标记物。不仅包含尿或血液中包含的源自生物体的物质,还包含心电图、血压、PET图像、骨密度、肺功能等。另外,随着染色体组解析以及蛋白质组解析的发展,发现了与DNA、RNA及生物体蛋白等相关联的各种生物标记物。

生物标记物不仅应用于患上疾病后的治疗效果的测定,还作为用于预防疾病的日常的指标而应用于疾病的预防,并且还被期待应用于选择避免副作用的有效治疗法的个体化医疗。但是,在神经/精神疾病的情况下,虽然从生物化学或分子遗传学的观点出发还研究出了能够利用为客观性指标的分子标记物等,但仍处于应该称为研究阶段这样的状况。

另一方面,还报告了使用NIRS(Near-InfraRed Spectroscopy:近红外光谱)技术来根据通过生物体光测量而测量出的血红蛋白信号中的特征量进行精神分裂症、抑郁症等精神疾病的分类的疾病判定系统等(专利文献1)。将专利文献1的公开全部通过参照引用于此处。

(基于脑活动的生物标记物)

另一方面,在磁共振成像法(MRI:Magnetic Resonance Imaging)中,使用与血流量的变化相应地在检测出的信号中出现变化的情形,也能够使大脑对于外部刺激等的活动部位视觉化。将这种磁共振成像法特别称为fMRI(functional MRI:功能性磁共振成像)。

在fMRI中,作为装置,使用了在通常的MRI装置中进一步配备fMRI测量所需要的硬件和软件而成的装置。

在此,血流量的变化引起NMR信号强度的变化是利用了血液中的氧合血红蛋白和脱氧血红蛋白的磁学性质不同。氧合血红蛋白具有反磁性体的性质,对于周围存在的水的氢原子的弛豫时间没有影响,与此相对,脱氧血红蛋白为顺磁性体,使周围的磁场变化。因而,当大脑受到刺激、局部血流增大从而氧合血红蛋白增加时,能够将其变化量检测为MRI信号。这种对受验者的刺激例如使用视觉刺激、听觉刺激、或规定课题(任务)的执行等(例如专利文献2)。将专利文献2的公开全部通过参照引用于此处。

在此,在脑功能研究中,通过测定与微静脉及毛细血管内的红血球中的脱氧血红蛋白的浓度减少的现象(BOLD效应)对应的氢原子的磁共振信号(MRI信号)的上升,来进行大脑的活动的测定。

像这样,将反映出由fMRI装置测量出的脑活动的血中氧浓度依赖信号称为BOLD信号(Blood Oxygen Level Dependent Signal:血氧水平依赖信号)。

特别是,在与人的运动功能有关的研究中,使受验者进行一些运动,并通过上述MRI装置测定大脑的活动。

另外,在是人的情况下,需要进行非侵入式的脑活动的测量。因此,能够从fMRI数据提取更详细的信息的解码技术逐渐发展起来(例如非专利文献1)。将非专利文献1的公开全部通过参照引用于此处。特别是,通过fMRI以大脑中的体素(volumetric pixel:voxel)为单位对脑活动进行解析,能够根据脑活动的空间图案来估计刺激输入或识别状态。

并且,作为这种使解码技术发展了的技术,在专利文献3中公开了用于通过脑功能图像法实现对于神经/精神疾病的生物标记物的脑活动解析方法。将专利文献3的公开全部通过参照引用于此处。在本方法中,根据对于健康组、患者组测定出的静息态功能连接的MRI的数据,来针对各个受验者导出规定的脑区域间的活动度的相关阵列。对于包含受验者的疾病/健康标签的受验者的属性和相关阵列,通过正则化典型相关分析进行特征提取。基于正则化典型相关分析的结果,通过基于稀疏逻辑回归(Sparse Logistic Regression:SLR)的判别分析来生成作为生物标记物而发挥功能的判别器。通过这样的机器学习的技术,表示出能够基于根据静息态的fMRI数据导出的脑区域间的连接来预测神经疾病的诊断结果。而且,该预测性能的验证表示出不仅适用于在一个设施中测量出的脑活动,还能够在某种程度上通用于在其它设施中测量出的脑活动。

并且,对于这样的生物标记物,还进行了用于提高通用化性能的技术改进(专利文献4)。将专利文献4的公开全部通过参照引用于此处。

另外,最近,如美国的人类连接组项目(human connectome project)那样获得大规模的脑图像数据并共享这些数据被认为对于填补基础神经科学研究与如精神疾病的诊断及治疗那样的临床应用之间的缺口具有重要的意义(非专利文献2)。将非专利文献2的公开全部通过参照引用于此处。

在2013年,日本的国立研究开发法人日本医疗研究开发机构组织了如下的解码神经反馈(DecNef)项目:8个研究所收集包括2,239个样本和5种疾病在内的多个地点的静息态的功能性磁共振(静息态的功能MRI)数据,并通过SRPBS(Strategic Research Programfor Brain Sciences(脑科学研究战略研究项目)https://www.amed.go.jp/program/list/01/04/001_nopro.html)的多个地点的多种疾病的数据库(https://bicr-resource.atr.jp/decnefpro/)来公开共享这些数据。该项目确定了能够通用于完全独立的队列(cohort)的、几种精神疾病的基于静息态的功能连接性(静息态的功能连接MRI)的生物标记物。

但是,关于大规模地收集脑图像数据,对于健康者而言都不容易,而且对于患者特别不容易。

并且,当为了进行大规模的数据收集而实施多个地点处的测量时,各测量地点处的测量数据的地点间差异成为问题。

例如,为了评价在多个测量地点处进行了MRI测量的情况下的测量数据的地点间差异,还作出了通过采用大量的参加者前往多个地点接受测定这样的所谓“多设施受检者(traveling subject)”来调查测定偏倚对于静息态的功能连接性的效应的尝试(非专利文献3、非专利文献4)。将非专利文献3的公开和非专利文献4的公开全部通过参照引用于此处。

现有技术文献

专利文献

专利文献1:日本再表2006-132313号公报

专利文献2:日本特开2011-000184号公报

专利文献3:日本特开2015-62817号公报

专利文献4:日本特开2017-196523号公报

非专利文献

非专利文献1:Kamitani Y,Tong F.Decoding the visual and subjectivecontents of the human brain(解读人脑的视觉和主观内容).Nat Neurosci.2005;8:679-85.

非专利文献2:Glasser MF,et al.The Human Connectome Project'sneuroimaging approach(人类连接组项目的神经影像学方法).Nat Neurosci 19,1175-1187(2016).

非专利文献3:Noble S,et al.Multisite reliability of MR-basedfunctional connectivity(基于MR的功能连接的多站点可靠性).Neuroimage 146,959-970(2017).

非专利文献4:Pearlson G.Multisite collaborations and large databasesin psychiatric neuroimaging advantages,problems,and challenges(多站点协作和大型数据库在精神科神经影像学方面的优势、问题以及挑战).Schizophr Bull35,1-2(2009).

发明内容

发明要解决的问题

如以上那样,在考虑将基于功能性磁共振图像法等脑功能图像法对脑活动的解析应用于神经/精神疾病的治疗的情况下,例如,作为如上所述的生物标记物的基于脑功能图像法对脑活动的解析还被期待作为非侵入式的功能标记物而应用于面向诊断法的开发、用于实现根本治疗的药物研发的靶分子的搜索和确定等。

例如,目前为止,对于自闭症等精神疾病,还未完成使用了遗传基因的实际使用的生物标记物,因此,药物的效果判定等较难,因此治疗用药的开发也较难。

为了通过机器学习基于脑活动的测量数据生成判别器并将判别器作为生物标记物来实际使用,需要提高通过机器学习针对在一个设施中测量出的脑活动生成的生物标记物的预测精度。另外,需要能够将通过这样生成的生物标记物还通用于在其它设施中测量出的脑活动。

即,在通过机器学习基于脑活动的测量数据构建判别器时,主要存在两个课题。

第一课题是样本量小的问题。

作为受验者的人数的数据量N远小于测量出的脑活动测量数据的维数M,因此判别器的参数容易与训练数据过拟合。

由于该过拟合,构建出的判别器对于新采样到的测试数据呈现出非常差的性能。这是由于这些测试数据未被使用于训练判别器。

因而,对于判别器的期望的通用化,需要适当地导入正则化以仅识别并利用本质的特征量。

第二课题是只有在构建出的判别器对于在与收集训练数据的地点不同的拍摄地点处扫描得到的MRI数据也维持高性能的情况下,判别器才是在临床上有用且在科学上可靠的。这是涉及所有拍摄地点的所谓的通用化能力。

在收集与精神疾病相关联的大规模的脑图像数据时,脑图像由于在一个地点处能够获取的数据的量存在限制,因此需要从多个地点进行获取。然而,在获取多个地点处的脑图像数据的情况下,地点间差异成为最大的障碍。即,在临床应用中,经常观测到无法将使用在特定的地点处获取到的数据而训练出的判别器通用到在不同的地点处扫描得到的数据。

因此,在上述的人类连接组项目中,目前为止是假设在单一地点使用单一的扫描仪进行测量。

本发明是为了解决如上所述的问题点而完成的,其目的在于提供一种能够基于从多个设施获取到的脑测量数据来对各设施处的测定偏倚进行调整和校正的功能连接相关值的调整方法、功能连接相关值的调整系统。

本发明的另一目的在于提供一种用于实现基于用于协调从多个设施获取到的脑测量数据来辅助对神经/精神疾病的诊断的脑功能图像法、来进行的判别处理的脑活动分类器的协调方法、脑活动分类器的协调系统、脑活动解析装置以及脑活动解析方法。

本发明的另一目的在于提供一种用于实现基于脑活动测量的生物标记物的脑活动解析装置、脑活动解析方法、脑活动生物标记物系统以及脑活动生物标记物系统的程序。

用于解决问题的方案

按照本发明的一个方面,用于对受验者的在多个测量地点处被测量出的脑功能连接相关值进行校正的脑功能连接相关值的调整方法包括以下步骤:对于在多个测量地点处分别共同地成为测量对象的多个移动受验者,测量各移动受验者的预先决定的多个脑区域的脑活动;对于各移动受验者计算脑功能连接阵列的规定的元素,该脑功能连接阵列表示一组多个脑区域的脑活动的时间相关性;通过使用一般线性混合模型法,针对脑功能连接阵列的每个规定的元素计算测定偏倚,来作为各测量地点处的相对于涉及多个测量地点和多个移动受验者的该元素的平均而言的固定效应;以及使用测定偏倚对脑功能连接相关值进行校正来获得调整值,该脑功能连接相关值是受验者的在各测量地点处被测量出的脑功能连接阵列的规定的元素。

按照本发明的另一方面,用于校正对象者的脑功能连接相关值的脑功能连接相关值的调整系统具备:多个脑活动测量装置,所述多个脑活动测量装置分别设置于多个测量地点处,以按时间序列测量多个受验者的脑活动;以及计算处理系统,其用于对脑功能连接相关值进行校正,其中,计算处理系统包括用于保存数据的存储装置,存储装置保存对于在多个测量地点处分别共同地成为测量对象的多个移动受验者测量各移动受验者的预先决定的多个脑区域的脑活动而得到的结果,计算处理系统还包括运算装置,运算装置对于各移动受验者计算脑功能连接阵列的规定的元素,该脑功能连接阵列表示一组多个脑区域的脑活动的时间相关性,运算装置通过使用一般线性混合模型法,针对脑功能连接阵列的每个规定的元素计算测定偏倚,来作为各测量地点处的相对于涉及多个测量地点和多个移动受验者的该元素的平均而言的固定效应,运算装置使用测定偏倚对脑功能连接相关值进行校正来计算调整值,该脑功能连接相关值是受验者的在各测量地点处被测量出的脑功能连接阵列的规定的元素。

按照本发明的又一方面,用于对多个受验者的在多个测量地点处被测量出的至少一个属性执行分类处理的脑活动分类器的协调方法包括以下步骤:对于在多个测量地点处分别共同地成为测量对象的多个移动受验者,测量各移动受验者的预先决定的多个脑区域的脑活动;对于各移动受验者计算脑功能连接阵列的规定的元素,该脑功能连接阵列表示一组多个脑区域的脑活动的时间相关性;通过使用一般线性混合模型法,针对脑功能连接阵列的每个规定的元素计算测定偏倚,来作为各测量地点处的相对于涉及多个测量地点和多个移动受验者的该元素的平均而言的固定效应;使用测定偏倚对脑功能连接相关值进行校正来分别获得调整值,该脑功能连接相关值是多个作为训练数据对象的受验者的在各测量地点处被测量出的脑功能连接阵列的规定的元素;以及基于调整值,来通过伴有特征选择的机器学习法生成针对属性的分类器。

优选的是,在各测量地点处被测量脑活动的多个作为训练数据对象的受验者包括具有属性的第一组受验者和不具有属性的第二组受验者,计算测定偏倚的步骤包括以下步骤:通过使用一般线性混合模型法,针对脑功能连接阵列的每个规定的元素计算测定偏倚、第一组的抽样偏倚以及第二组的抽样偏倚,来作为各测量地点处的相对于涉及多个测量地点、多个移动受验者以及多个作为训练数据对象的受验者的该元素的平均而言的固定效应。

更优选的是,在一般线性混合模型法中,通过基于L2归一化的最小二乘回归来计算测定偏倚。

更优选的是,伴有特征选择的机器学习法是使用LASSO(least absoluteshrinkage and selection operator:最小绝对收缩与选择算子)的逻辑回归分析法。

按照本发明的又一方面,用于基于对象者的脑活动的测量结果来对至少一个属性执行分类处理的脑活动分类器的协调系统具备:多个脑活动测量装置,所述多个脑活动测量装置分别设置于多个测量地点处,以按时间序列测量多个受验者的脑活动;以及计算处理系统,其用于对脑功能连接相关值进行校正,该脑功能连接相关值是表示作为训练数据对象的受验者的脑活动的时间相关性的脑功能连接阵列的规定的元素,其中,计算处理系统包括用于保存数据的存储装置,存储装置保存对于在多个测量地点处分别共同地成为测量对象的多个移动受验者测量各移动受验者的预先决定的多个脑区域的脑活动而得到的结果,计算处理系统还包括运算装置,运算装置对于各移动受验者计算脑功能连接阵列的规定的元素,通过使用一般线性混合模型法,针对脑功能连接阵列的每个规定的元素计算测定偏倚,来作为各测量地点处的相对于涉及多个测量地点和多个移动受验者的该元素的平均而言的固定效应,运算装置使用测定偏倚对脑功能连接相关值进行校正来分别计算调整值,该脑功能连接相关值是多个作为训练数据对象的受验者的在各测量地点处被测量出的脑功能连接阵列的规定的元素,运算装置基于调整值,来通过伴有特征选择的机器学习法生成针对属性的分类器。

优选的是,在各测量地点处被测量脑活动的多个作为训练数据对象的受验者包括具有属性的第一组和不具有属性的第二组,运算装置在计算测定偏倚时,通过使用一般线性混合模型法,针对功能连接阵列的每个规定的元素计算测定偏倚、第一组的抽样偏倚以及第二组的抽样偏倚,来作为各测量地点处的相对于涉及多个测量地点、多个移动受验者以及多个作为训练数据对象的受验者的该元素的平均而言的固定效应。

优选的是,在一般线性混合模型法中,通过基于L2归一化的最小二乘回归来计算测定偏倚。

优选的是,伴有特征选择的机器学习法是使用LASSO的逻辑回归分析法。

按照本发明的又一方面,使用了用于基于对象者的脑活动的测量结果来对至少一个与疾病的有无有关的属性执行分类处理的脑活动分类器的脑活动生物标记物系统具备:多个脑活动测量装置,所述多个脑活动测量装置分别设置于多个测量地点处,以按时间序列测量多个受验者的脑活动;以及计算处理系统,其用于对脑功能连接相关值进行校正,该脑功能连接相关值是表示受验者的脑活动的时间相关性的脑功能连接阵列的规定的元素,其中,计算处理系统包括存储装置和运算装置,运算装置通过从脑功能连接相关值中去除测定偏倚来分别计算校正后的调整值并保存到存储装置中,该脑功能连接相关值是多个受验者的在各测量地点处被测量出的脑功能连接阵列的规定的元素,运算装置基于调整值来通过伴有第一特征选择的机器学习生成脑活动分类器。

优选的是,存储装置预先保存有对于在多个测量地点处分别共同地成为测量对象的多个移动受验者测量各移动受验者的预先决定的多个脑区域的脑活动而得到的结果,运算装置对于各移动受验者计算脑功能连接阵列的规定的元素,该脑功能连接阵列表示一组多个脑区域的脑活动的时间相关性,通过使用一般线性混合模型法,针对脑功能连接阵列的每个规定的元素计算测定偏倚,来作为各测量地点处的相对于涉及多个测量地点和多个移动受验者的该元素的平均而言的固定效应。

优选的是,所述运算装置基于对象者的在多个测量地点中的任一个测量地点处被测量出的测量数据,来对与疾病的有无有关的属性执行分类处理。

优选的是,在伴有第一特征选择的机器学习中,i)运算装置将调整值分割为机器学习用的训练数据集和验证用的测试数据集,ii)运算装置对训练数据集执行规定数量的欠采样和子采样,来生成规定数量的子样本,iii)运算装置通过利用稀疏建模法的特征选择来针对每个子样本生成分类器子模型,iv)运算装置基于利用稀疏采样法的特征选择,来生成针对与疾病的有无有关的属性的分类器。

优选的是,伴有第一特征选择的机器学习包括具有外侧的交叉验证和内侧的交叉验证的嵌套构造的交叉验证,在嵌套构造的交叉验证的处理中,i)运算装置将外侧的交叉验证设为K折交叉验证,来将调整值分割为机器学习用的训练数据集和验证用的测试数据集,ii)运算装置对训练数据集执行规定数量的欠采样和子采样,来生成规定数量的子样本,iii)运算装置在K折交叉验证的各循环中,通过内侧的交叉验证来对每个子样本生成分类器子模型,iv)运算装置基于分类器子模型,来生成脑活动分类器。

优选的是,存储装置针对多个受验者中的每一个受验者保存有疾病的评价标准的信息,运算装置基于调整值,来通过伴有第二特征选择的机器学习生成疾病的评价标准的回归模型,确定通过第一特征选择和第二特征选择而被共同地提取出的脑功能连接。

按照本发明的又一方面,一种计算机程序,用于控制脑活动生物标记物系统的动作,该脑活动生物标记物系统使用了用于基于对象者的脑活动的测量结果来对至少一个与疾病的有无有关的属性执行分类处理的脑活动分类器,脑活动生物标记物系统包括:多个脑活动测量装置,所述多个脑活动测量装置分别设置于多个测量地点处,以按时间序列测量多个受验者的脑活动;以及计算处理系统,其具有存储装置和运算装置,用于对脑功能连接相关值进行校正,该脑功能连接相关值是表示受验者的脑活动的时间相关性的脑功能连接阵列的规定的元素,计算机程序使运算装置执行以下步骤:通过从脑功能连接相关值中去除测定偏倚,来分别计算调整值并保存到存储装置中,脑功能连接相关值是多个受验者的在各测量地点处被测量出的脑功能连接阵列的规定的元素;以及基于调整值,来通过伴有第一特征选择的机器学习生成脑活动分类器。

优选的是,存储装置预先保存有对于在多个测量地点处分别共同地成为测量对象的多个移动受验者测量各移动受验者的预先决定的多个脑区域的脑活动而得到的结果,计算机程序使运算装置执行以下步骤:对于各移动受验者计算脑功能连接阵列的规定的元素,该脑功能连接阵列表示一组多个脑区域的脑活动的时间相关性;通过使用一般线性混合模型法,针对脑功能连接阵列的每个规定的元素计算测定偏倚,来作为各测量地点处的相对于涉及多个测量地点和多个移动受验者的该元素的平均而言的固定效应。

优选的是,使所述运算装置还执行以下步骤:基于对象者的在多个测量地点中的任一个测量地点处被测量出的测量数据,来对与疾病的有无有关的属性进行分类处理。

优选的是,在伴有第一特征选择的机器学习中,运算装置执行以下步骤:i)将调整值分割为机器学习用的训练数据集和验证用的测试数据集;ii)对训练数据集执行规定数量的欠采样和子采样,来生成规定数量的子样本;iii)通过利用稀疏建模的特征选择来针对每个子样本生成分类器子模型;以及iv)基于利用稀疏建模进行的特征选择,来生成针对与疾病的有无有关的属性的分类器。

优选的是,伴有第一特征选择的机器学习包括具有外侧的交叉验证和内侧的交叉验证的嵌套构造的交叉验证,在嵌套构造的交叉验证的处理中,运算装置执行以下步骤:

i)将外侧的交叉验证设为K折交叉验证,来将调整值分割为机器学习用的训练数据集和验证用的测试数据集;ii)对训练数据集执行规定数量的欠采样和子采样,来生成规定数量的子样本;iii)在K折交叉验证的各循环中,通过内侧的交叉验证来对每个子样本生成分类器子模型;以及iv)基于分类器子模型,来生成脑活动分类器。

优选的是,存储装置针对多个受验者中的每一个受验者保存有疾病的评价标准的信息,运算装置执行以下步骤:基于调整值,来通过伴有第二特征选择的机器学习生成疾病的评价标准的回归模型;以及确定通过第一特征选择和第二特征选择而被共同地提取出的脑功能连接。

发明的效果

根据本发明,能够对在多个设施处测量出的大脑的活动的测量数据调整和校正各设施处的测定偏倚。由此,能够基于多个设施处的测量数据来调整脑功能连接相关值。

另外,根据本发明,能够实现能够协调在多个设施处测量出的大脑的活动的测量数据来提供用于客观地判断健康或疾病的状态的数据的脑活动分类器的协调方法、脑活动分类器的协调系统、脑活动解析系统以及脑活动解析方法。

或者,根据本发明,能够实现对于在多个设施处测量出的大脑的活动的测量数据的、关于神经/精神疾病的基于脑功能图像法的脑活动生物标记物系统、脑活动生物标记物系统的程序。

附图说明

图1是用于针对由设置于多个测量地点处的MRI测量系统测量出的数据来说明协调化处理的概念图。

图2是示出针对受验者的大脑的关心区域(ROI:Region of Interest)提取表示静息态的功能连接的相关性的相关阵列的过程的概念图。

图3是示出“测定参数”和“受验者属性数据”的内容的例子的概念图。

图4是示出设置于各测量地点处的MRI装置100.i(1≤i≤Ns)的整体结构的示意图。

图5是数据处理部32的硬件框图。

图6是用于说明本实施方式的rs-fcMRI法中在地点间移动来接受测量的移动受验者的地点间差异的评价手法的概念图。

图7是用于说明受验者a的第b个功能连接性的表现的概念图。

图8是说明根据相关阵列来生成作为生物标记物的判别器的过程的概念图。

图9是用于说明执行协调化处理、判别器生成处理、判别处理的计算处理系统300的结构的功能框图。

图10是用于更详细地说明执行协调化处理、判别器生成处理、判别处理的计算处理系统300的结构的功能框图。

图11是用于说明协调化处理的流程图。

图12是示出判别处理部3000生成针对受验者的疾病或健康标签的判别器的处理的流程图。

图13是用于说明在执行了协调化处理之后追加了新的测量地点的情况下的协调化处理的概念图。

图14是示出协调化处理中使用的多疾病数据库的数据和多设施受检者的数据集的概念图。

图15是示出SRPBS的多疾病数据集的内容的图。

图16是示出各测量地点处的拍摄协议的图。

图17是示出使通过主成分分析得到的地点间差异和疾病效应视觉化的图表。

图18是基于分层聚类分析的树状图。

图19是示出关于各因素的贡献大小的图。

图20是示出“抽样偏倚”的背景下的机制的概念图。

图21是使协调化过程的影响视觉化的图,是与图17进行对比的图。

图22是示出分类器对于MDD的分类性能的图。

图23是示出分类器对于SCZ的分类性能的图。

图24是示出MDD分类器对于独立队列的性能的图。

图25是示出SCZ分类器对于独立队列的性能的图。

图26是示出独立的队列中的实际年龄和预测出的年龄的散布图的图。

图27是示出独立的队列中的实际年龄和预测出的年龄的散布图的图。

图28是示出分散地进行数据收集、估计处理以及对象者的脑活动测量的情况下的一例的功能框图。

图29是示出第三实施方式的多设施受检者的巡回方式的图。

图30是示出学习用的数据集(第一数据集)的人群特性的图。

图31是示出独立验证的数据集(第二数据集)的人群特性的图。

图32是用于说明用于生成分类器的机器学习的过程的流程图。

图33是示出关于全部拍摄地点的对于学习用数据集的预测MDD的预测性能(输出的概率分布)的图。

图34是示出关于各拍摄地点的对于学习用数据集的预测MDD的预测性能(分类器的输出的概率分布)的图。

图35是示出独立的验证数据集中的MDD的分类器的输出的概率分布的图。

图36是示出关于各拍摄地点的、MDD的分类器对于独立验证数据集的输出的概率分布的图。

图37是导出精神疾病(例如重性抑郁障碍)的诊断和症状中共通的脑内的功能连接的过程的概念图。

图38是用于说明生成如预测症状的评价标准(例如贝克抑郁自评量表II)那样的回归模型的过程的流程图。

图39是示出基于学习用数据集生成的回归模型的预测性能的图。

图40是示出独立的验证数据集时的BDI得分的回归模型的性能的图。

图41是示出MDD分类器和BDI回归模型双方的构建中共通的7个脑功能连接FC的空间分布的图。

图42是示出表示共通的7个脑功能连接FC的特性的列表的图。

图43是示出共通的功能连接FC中的学习用数据集与独立的验证数据集之间的功能连接FC的值的图。

具体实施方式

下面,按照附图来说明本发明的实施方式的MRI测量系统的结构。此外,在下面的实施方式中,标注有相同标记的构成要素和处理工序是相同或相当的构成要素和处理工序,在不必要的情况下,不重复对其进行说明。

另外,在本实施方式中,将本发明设为如下来进行说明:通过设置于多个设施处的“脑活动测量装置”、更具体地说“MRI测量系统”按时间序列测量大脑的多个区域间的脑活动,并基于这些区域间的时间相关性的图案来对受验者进行分类。

而且,这种“MRI测量系统”被设置于多个不同的设施处,如后述的那样,针对这些测量设施(测量地点)间的对于测量而言的地点间差异,独立地评价因测定设备而引起的测定偏倚和因测量地点处的受验者的数量而引起的差异(抽样偏倚)。在此基础上,通过对于各测量地点处的测量值实施去除测定偏倚的效应以校正地点间差异的处理,由此实现对于测量地点间的测定结果的调和处理(协调化)。

[第一实施方式]

图1是用于说明针对由设置于多个测量地点处的MRI测量系统测量出的数据进行的协调化处理的概念图。

参照图1,设为在测量地点MS.1~MS.Ns(Ns:地点数量)处分别设置了MRI装置100.1~100.Ns。在测量地点MS.1~MS.Ns处,分别对受验者组PA.1~PA.Ns进行测量。设为受验者组PA.1~PA.Ns各自包含被分类为至少两个以上的组、例如患者组和健康者组。另外,作为患者组,虽然没有特别限定,但是例如符合的有精神疾病的患者、更确定地说“重性抑郁症的患者”的组。

而且,在各测量地点处,原则上按照MRI装置的规格而在可能的范围内以统一的测量协议对受验者实施测量。

在此,虽然没有特别限定,但是作为测量协议,例如设为规定了下面那样的内容。

1)执行头部的扫描的方向

例如,需要规定按从头部的后侧(posterior:下面简写为“P”)朝向前侧(anterior:下面简写为“A”)的方向(下面称为“P→A方向”)、以及相反的方向即从前侧朝向后侧的方向(下面称为“A→P方向”)中的哪一个方向进行扫描。根据状况的不同,也可能规定进行两个方向的扫描。

根据MRI装置的不同,也可能存在默认的方向不同、或者无法任意地对两个方向进行设定的情况。

扫描的方向例如可能规定作为图像而言的“变形方式”,从而将条件设定为协议。

2)脑构造图像的拍摄条件

设定用于通过所谓的自旋回波法拍摄“T1增强图像”和“T2增强图像”中的任一方或两方的条件。

3)脑功能图像的拍摄条件

设定用于通过fMRI(functional Magnetic Resonance Imaging:功能性磁共振成像)法拍摄“静息态”的受验者的脑功能图像的条件。

4)扩散增强图像的拍摄条件

设定是否拍摄扩散增强图像(DWI:diffusion(weighted)image(扩散加权成像)),而且设定该拍摄的条件。

扩散增强图像是MRI拍摄序列的一种,是使水分子的扩散运动图像化而得到的。在通常使用的自旋回波法的脉冲系列中,能够忽略因扩散所致的信号的衰减。但是,当长时间连续施加大的倾斜磁场时,由于该期间的各磁化向量的移动而产生的相位偏移无法再忽略,扩散越活跃的区域表现为越低信号。扩散增强图像是利用该现象的图像。

5)用于通过图像处理来校正EPI畸变的拍摄

例如,作为用于通过图像处理来校正EPI畸变的一个方法,已知有“场图法”,针对空间畸变的校正来设定拍摄的条件。

场图法是根据多重回波时间来收集EPI图像,基于这些EPI图像计算EPI畸变的量。能够应用场图法来校正新的图像中包含的EPI畸变。能够以根据不同的回波时间对同一解剖学构造获得的一组图像为前提,计算EPI畸变,来校正图像的畸变。

例如,在下面的公知文献1中公开了“场图法”。将公知文献1的公开全部通过参照引用于此处。

公知文献1:日本特开2015-112474号说明书

此外,对于测量协议,可以从上述的条件中适当地提取需要的序列部分、也可以根据需要而追加其它序列或该其它序列的条件。

再次参照图1,将采用为在各测量地点MS.1~MS.Ns处进行测量的受验者称为“采样”,由于各测量地点处的采样的不均而产生的测量值的地点间差异的原因称为“抽样偏倚”。

例如,在上述的例子中,已知的是,在按以往的诊断基准被诊断为“重性抑郁症”的患者中实际包括一些亚型患者。

典型的是,这些亚型为忧郁症性(melancholic)抑郁症、非忧郁症性(nonmelancholic)抑郁症、难治型抑郁症等。在各测量地点处,由于前往该测量地点的医院就诊的患者的因地域性而引起的性质的偏颇以及该医院中的诊断的倾向等各种因素,即使总体上说是“重性抑郁症”的患者,但该患者组中包括的亚型的分布也未必是均匀的。其结果是,各测量地点的患者组的亚型分布通常会产生不均,其结果被认为产生上述的“抽样偏倚”。

另外,即使是被称为“健康组”的受验者的组,在该组中也通常存在多个亚型,在这一点上,“健康组”也存在“抽样偏倚”。

另外,MRI装置100.1~100.Ns也不能说是在各测量地点使用了绝对相同的测量特性的MRI装置。

例如,能够与MRI装置的制造商、MRI装置的型号、MRI装置的静磁场强度、MRI装置中的(发送)接收线圈的线圈数(通道数)等MRI装置的条件、MRI装置的测量条件等测定条件相应地产生测量数据的地点间差异。将由于这种测定条件而产生的地点间差异称为“测定偏倚”。

即使是相同的MRI装置的制造商的相同型号的MRI装置,也由于装置的固有的独特性而不能说一定实现完全相同的测量特性。

在此,作为(发送)接收线圈,一般来说为了提高测量出的信号的SN比而采用“多阵列线圈”。“接收线圈的线圈数”是指构成多阵列线圈的“元件线圈”的个数。通过提高各个元件线圈的灵敏度,并捆绑其输出,由此实现接收灵敏度的提高。

而且,在本实施方式中,能够通过如后面说明的手法来独立地评价“抽样偏倚”和“测定偏倚”。

再次参照图1,从各测量地点MS.1~MS.Ns分别获得的测量关联数据DA100.1~DA100.Ns被累积并保存到数据中心200内的存储装置210。

在此,“测量关联数据”包含各测量地点处的“测定参数”以及在各测量地点处测量出的“患者组数据”和“健康组数据”。

并且,“患者组数据”和“健康组数据”分别与各个受验者对应地包含“患者的MRI测量数据”和“健康者的MRI测量数据”。

下面,对这种“测量关联数据”进行说明。图2是示出针对受验者的大脑的关心区域(ROI:Region of Interest)提取表示静息态的功能连接的相关性的相关阵列的过程的概念图。

在此,在图1中,“患者组数据”和“健康组数据”中的“患者的MRI测量数据”和“健康者的MRI测量数据”至少包含如下的数据。

i)用于计算相关阵列的数据的按时间序列的“脑功能图像数据”,和/或相关阵列的数据本身

即,图1中的计算处理系统300将这些数据用作成为在基于存储装置210内保存的数据计算如后述那样的脑活动生物标记物时的基础的数据。

在此,能够设为如下的结构:在各测量地点处基于按时间序列的“脑功能图像数据”计算出相关阵列的数据之后,将相关阵列的数据保存到存储装置210内,计算处理系统300基于该存储装置210内的相关阵列的数据来计算脑活动生物标记物。

或者,也能够设为如下的结构:将按时间序列的“脑功能图像数据”保存到存储装置210内,计算处理系统300基于该存储装置210内的“脑功能图像数据”来计算相关阵列的数据,再计算脑活动生物标记物。

因而,关于“患者的MRI测量数据”和“健康者的MRI测量数据”的各个数据,至少包含用于计算相关阵列的数据的按时间序列的“脑功能图像数据”和相关阵列的数据本身中的任一方。

ii)受验者的构造图像数据和扩散增强图像数据

此外,虽然没有特别限定,但是关于通过图像处理来校正EPI畸变的处理,能够设为在各测量地点处进行了运算处理之后将数据保存到存储装置210内的结构。

另外,虽然没有特别限定,但是从个人信息保护的观点出发,能够设为在将数据保存到存储装置210内之前在各测量地点处执行匿名加工处理的结构。其中,关于匿名加工处理,在运营计算处理系统300的主体被合法授权处理个人信息的情况下,可以设为在计算处理系统300中执行匿名加工处理。

返回图2,如图2的(A)所示,根据实时测定出的静息态的fMRI的n个(n:自然数)时刻的fMRI数据计算各关心区域的平均的“活动度”,如图2的(B)所示,计算脑区域间(关心区域间)的功能连接性(“活动度的相关值”)的相关阵列。

计算功能连接性,来作为依赖于各参加者的两个脑区域间的静息态的功能MRI的血中氧浓度的、(BOLD)信号的时间上的相关性。

在此,作为关心区域,由于如上述那样考虑Nc区域,因此当考虑对称性时,相关阵列中的独立的非对角成分为

Nc×(Nc-1)/2(个)。

作为关心区域的设定的方法,假定如下那样的方法。

方法1)“基于解剖学上的脑区域来定义关心区域。”

在此,对于脑活动生物标记物,例如采用140个区域作为关心区域。

也就是说,在该方法中,关于ROI,除了使用脑沟图谱(Brain Sulci Atlas:BAL)中包含的137个ROI以外,还使用自动解剖标记图集(Automated Anatomical LabelingAtlas)的小脑(左右)和蚓部的ROI。将这些共140个ROI间的功能连接FC用作特征量。

在此,脑沟图谱(Brain Sulci Atlas:BAL)和自动解剖标记图集(AutomatedAnatomical Labeling Atlas)在下面的公知文献2和公知文献3中有公开。将公知文献2和公知文献3的公开全部通过参照引用于此处。

公知文献2:Perrot et al.,Med Image Anal,15(4),2011

公知文献3:Tzourio-Mazoyer et al.,Neuroimage,15(1),2002

作为这样的关心区域,例如存在如下的区域、即

背内侧前额叶皮层(DMPFC)、

腹内侧前额叶皮质(VMPFC)、

前扣带皮层(ACC)、

小脑蚓部、

左丘脑、

右下顶叶、

右尾状核、

右枕中叶、

右中扣带皮层。

其中,采用的大脑的区域不限定于这样的区域。例如,也可以与设为对象的神经/精神疾病相应地变更要选择的区域。

方法2)“基于覆盖整个大脑的功能大脑地图的脑区域来定义功能连接性。”

在此,关于这种功能大脑地图的脑区域,在如下的文献中也进行了公开,虽然没有特别限定,但是例如能够设为由268个节点(脑区域)构成这样的结构。将下面的公知文献4至公知文献7的公开全部通过参照引用于此处。

公知文献4:Noble S,et al.Multisite reliability of MR-based functionalconnectivity(基于MR的功能连接的多站点可靠性).Neuroimage 146,959-970(2017).

公知文献5:Finn ES,et al.Functional connectome fingerprinting:identifying individuals using patterns of brain connectivity(功能连接组指纹图谱:利用大脑连接模式识别个体).Nat Neurosci 18,1664-1671(2015).

公知文献6:Rosenberg MD,et al.A neuromarker of sustained attentionfrom whole-brain functional connectivity(从全脑功能连接看持续注意的神经标志物).Nat Neurosci 19,165-171(2016).

公知文献7:Shen X,Tokoglu F,Papademetris X,Constable RT.Groupwisewhole-brain parcellation from resting-state fMRI data for network nodeidentification(从静止状态的fMRI数据中进行全脑分组解析,用于网络节点识别).Neuroimage 82,403-415(2013).

下面,设为使用基于“方法2”的功能大脑地图的脑区域定义功能连接性的方法来进行说明。对于功能连接性的测量存在几个候选,例如切线法或局部相关法。然而,下面使用皮尔逊相关系数。

关于被预处理后的BOLD信号的每个可能的节点组的时间经过的期间,计算fisher-z变换后的皮尔逊相关系数,并使用于构建268×268的对称的连接矩阵,该矩阵的元素分别表示两个节点间的连接性的强度。在该情况下,使用连接矩阵的下三角阵列的35,778个(也就是说,(268×267)/2)的连接强度(连接性)的值。

关于这种相关阵列的元素的计算,没有特别限定,但是例如能够如下面那样执行计算。

根据静息态脑活动数据,对于各受验者计算不同的关心区域(Region ofinterest、ROI)之间的功能连接(Functional connectivity、FC)。FC是静息态脑活动解析中一般利用的特征量,利用不同的ROI的时间序列信号间的皮尔逊相关系数来定义FC。

首先,提取各ROI中包括的全部体素的平均信号的时间序列。

虽然没有特别限定,但是静息态的功能MRI数据被实施如下的预处理。数据的最初10秒因考虑T1平衡而被废弃。预处理步骤包括时间层(slice timing)的校正、重校准(re-alignment)、通过T1增强对构造图像进行的分割、向蒙特利尔神经研究所(MNI)空间的标准化、以及使用6mm半值全宽的各向同性的高斯核进行的空间平滑。

关于相关阵列(连接矩阵(connectivity matrix))的分析,通过为了对最相似的体素进行聚类而开发出的如上所述的268个节点的灰白质地图来描述ROI。从这些268个ROI中提取BOLD信号的时间经过。为了去除一些杂散变化,使用基于六个运动参数、全脑平均信号、白质以及脑脊液那样的36个回归参数的线性回归。对于全部的参数而言,还包括微分系数和二次项。

为了将分析限制于低频的变动,而使用具备0.01Hz与0.08Hz之间的通带的一阶巴特沃斯滤波器,按时间序列进行带通滤波。

将回归后的残差系列考虑为与功能连接相关联的时间序列信号值,在不同的ROI的时间序列间计算皮尔逊相关系数。

图3是示出“测定参数”和“受验者属性数据”的内容的例子的概念图。

“受验者属性数据”设为在图1的“患者组数据”或“健康组数据”中被与“患者的MRI测量数据”及“健康者的MRI测量数据”分别进行关联来保存。

如图3的(A)所示,测定参数包含用于识别测量地点的地点ID、地点名称、用于识别测定参数的条件ID、与测量装置有关的信息以及与测量条件有关的信息。

“与测量装置有关的信息”包含在各测量地点处用于测量受验者的脑活动的MRI装置的制造商名称、型号以及(发送)接收线圈数。此外,“与测量装置有关的信息”不限于这些,例如也可以包含静磁场强度、匀场(shimming)调整后的磁场的均匀性等其它的表示测量装置的性能的指标等。

“与测量条件有关的信息”包含图像重构时的相位编码的方向(P→A或A→P)、图像种类(T1增强、T2增强、扩散增强等)、拍摄序列(自旋回波等)、拍摄中的受验者的睁眼/闭眼等信息。“与测量条件有关的信息”也不限于这些。

如图3的(B)所示,“受验者属性数据”包含以不能识别出受验者的方式进行了匿名控制的受验者临时ID、表示对该受验者进行测量时的测定条件的条件ID以及受验者的属性信息。

而且,“受验者的属性信息”包含受验者的性别、年龄、表示健康和疾病中的任一个的标签、由医生对受验者诊断出的诊断病名称、给受验者用药的用药历史记录、诊断历史记录等信息。此外,“受验者的属性信息”设为根据需要而例如在测量地点处被进行了匿名加工处理。

例如,关于年龄及性别等,能够对受验者的属性信息进行加工以维持“k-匿名性”,“k-匿名性”是通过进行转换数据以使准标识符(相同属性)的数据为k件以上等的处理来将个人被确定出的概率降低为k分之一以下使得难以进行确定。在此,“准标识符”是指通过“年龄”、“性别”、“居住地”等单个信息无法确定出个人但是通过进行组合能够确定出个人的属性。用药历史记录和诊断历史记录根据需要而被进行用于匿名化的处理,例如随机生成日期或调整日期等。

而且,下面,关于“患者的MRI测量数据”和“健康者的MRI测量数据”,将作为经时的各受验者的脑区域间的活动的相关性而通过上述的方法计算出的功能连接统称为各区域间的“功能连接性Connectivity”。在需要对各脑区域区分功能连接性的情况下,设为如后述那样附加后缀来进行区分。

(MRI装置的结构)

图4是示出设置于各测量地点处的MRI装置100.i(1≤i≤Ns)的整体结构的示意图。在图4中,例示性地详细说明了第一个测量地点处的MRI装置100.1。关于其它的MRI装置100.2~100.Ns,基本结构也是相同的。

如图4所示,MRI装置100.1具备:磁场施加机构11,其对受验者2的关心区域施加受到控制的磁场并照射RF波;接收线圈20,其接收来自该受验者2的响应波(NMR信号)并输出模拟信号;驱动部21,其对施加给该受验者2的磁场进行控制,并且控制RF波的发送和接收;以及数据处理部32,其用于设定该驱动部21的控制序列,并且对各种数据信号进行处理来生成图像。

此外,在此,将圆筒形状的腔(bore)的中心轴取为Z轴,将X轴定义为与Z轴正交的水平方向,将Y轴定义为与Z轴正交的铅直方向,其中,受验者2被置于该圆筒形状的腔内。

MRI装置100.1由于是这样的结构,因此构成受验者2的原子核的核自旋通过由磁场施加机构11施加的静磁场而被取向为磁场方向(Z轴),并且以该原子核固有的拉莫尔频率进行以该磁场方向为轴的岁差运动。

而且,当向受验者2照射与该拉莫尔频率相同的RF脉冲时,构成受验者2的原子进行共振,吸收能量而被激励,产生磁共振现象(NMR现象;核磁共振(Nuclear MagneticResonance))。在该共振后,当停止RF脉冲照射时,原子在释放能量而恢复为原始的稳定状态的弛豫过程中输出与拉莫尔频率相同的频率的电磁波(NMR信号)。通过接收线圈20接收所输出的该NMR信号作为来自受验者2的响应波,在数据处理部32中将受验者2的关心区域进行图像化。

磁场施加机构11具备静磁场产生线圈12、倾斜磁场产生线圈14、RF照射部16以及用于将受验者2置于腔内的卧具18。

受验者2例如仰卧在卧具18上。虽然没有特别限定,但是受验者2例如能够利用棱镜眼镜4观看与Z轴垂直设置的显示器6上显示的画面。也能够根据需要来通过该显示器6的图像对受验者2施加视觉刺激。此外,给予受验者2的视觉刺激也可以是通过投影仪将图像投影于受验者2的眼前的结构。在对受验者进行神经反馈的情况下这样的视觉刺激相当于反馈信息的呈现。

驱动部21具备静磁场电源22、倾斜磁场电源24、信号发送部26、信号接收部28以及将卧具18移动到Z轴方向上的任意位置的卧具驱动部30。

数据处理部32具备:输入部40,其受理由操作者(省略图示)进行的各种操作和信息输入;显示部38,其将与受验者2的关心区域有关的各种图像和各种信息显示于画面;存储部36,其存储用于执行各种处理的程序/控制参数/图像数据(构造图像等)以及其它的电子数据;控制部42,其对各功能部的动作进行控制,例如产生用于使驱动部21进行驱动的控制序列等;接口部44,其与驱动部21之间执行各种信号的发送接收;数据收集部46,其收集由源自关心区域的一组NMR信号构成的数据;图像处理部48,其基于该NMR信号的数据来形成图像;以及网络接口部50,其用于与网络之间执行通信。

另外,数据处理部32除了是专用计算机的情况以外,也可以是执行用于使各功能部动作的功能的通用计算机,该通用计算机基于安装在存储部36中的程序来进行指定的运算及数据处理以及控制序列的产生。下面,设数据处理部32为通用计算机来进行说明。

静磁场产生线圈12通过被静磁场电源22供给的电流流过绕Z轴卷绕的螺旋线圈而产生感应磁场,在腔内产生Z轴方向的静磁场。将受验者2的关心区域设定于该腔内形成的静磁场的均匀性高的区域。在此,更详细地说,静磁场线圈12例如由4个空芯线圈构成,通过该组合来在内部生成均匀的磁场,对受验者2的体内的规定的原子核、更确定地说氢原子核的自旋赋予取向性。

倾斜磁场产生线圈14由X线圈、Y线圈以及Z线圈(省略图示)构成,设置于呈圆筒形状的静磁场产生线圈12的内周面。此外,为了提高倾斜磁场的均匀性而设置了匀场线圈(未图示),实施“匀场调整”。

这些X线圈、Y线圈以及Z线圈分别一边依次切换X轴方向、Y轴方向以及Z轴方向一边对腔内的均匀磁场叠加倾斜磁场,来对静磁场赋予强度梯度。Z线圈在激励时使磁场强度向Z方向倾斜来限定共振面,Y线圈紧接着Z方向的磁场施加之后给予短时间的倾斜来对检测信号施加与Y坐标成比例的相位调制(相位编码),X线圈接下来在数据提取时给予倾斜来对检测信号施加与X坐标成比例的频率调制(频率编码)。

通过按照控制序列从发送部24向X线圈、Y线圈以及Z线圈分别输出不同的脉冲信号来实现该被叠加的倾斜磁场的切换。由此,能够确定被发现NMR现象的受验者2的位置,提供形成受验者2的图像所需要的三维坐标上的位置信息。

在此,如上所述,使用三组正交的倾斜磁场,并对各个倾斜分配层面选择方向、相位编码方向以及频率编码方向,通过它们的组合能够从各种角度进行摄影。例如,除了与一般通过X射线CT装置拍摄的图像相同方向的横断层面以外,还能够对与横断层面正交的弧矢层面或冠状层面、以及垂直于面的方向不与三组正交的倾斜磁场的轴平行的倾斜层面等进行拍摄。

RF照射部16按照控制序列,基于从信号发送部33发送的高频信号,来向受验者2的关心区域照射RF(Radio Frequency:射频)脉冲。此外,RF照射部16在图1中被内置于磁场施加机构11,但是也可以设置于卧具18,或者与接收线圈20一体化来构成为发送接收线圈20。

接收线圈20用于检测来自受验者2的响应波(NMR信号),为了高灵敏度地检测该NMR信号而被配置为接近受验者2。在此,在接收线圈20中,当NMR信号的电磁波切割接收线圈20的线圈线材时,基于电磁感应产生微弱电流。该微弱电流在信号接收部28中被放大,并且被从模拟信号变换为数字信号后发送到数据处理部32。

关于(发送)接收线圈20,如上述那样为了提高SN比而使用多阵列线圈。

即,当通过RF照射部16对在静磁场中增加了Z轴倾斜磁场的状态下的受验者2施加共振频率的高频电磁场时,磁场强度为共振条件的部分的规定原子核、例如氢原子核被选择性地激励而开始共振。满足共振条件的部分(例如受验者2的规定厚度的断层)内的规定原子核被激励,(在传统的图像绘制中)自旋轴同时进行旋转。当使激励脉冲停止时,在接收线圈20中,此时旋转着的自旋轴辐射的电磁波感应出信号,并在一段时间内检测到该信号。通过该信号,来观察受验者2的体内的含有规定原子的组织。而且,为了获知信号的发出位置,构成为施加X和Y的倾斜磁场来探测信号。

图像处理部48基于存储部36中所构建出的数据,来重复施加激励信号并对检测信号进行测定,通过第一次的傅立叶变换计算将共振的频率还原为X坐标并通过第二次的傅立叶变换还原Y坐标来获得图像,并在显示部38中显示对应的图像。

例如,通过这样的MRI系统,实时地拍摄上述的BOLD信号,通过控制部42对按时间序列拍摄的图像进行后面说明的那样的解析处理,由此能够进行静息态功能连接的MRI(rs-fcMRI)的拍摄。

在图4中,来自MRI装置100.1和其它测量地点处的MRI装置100.2~100.Ns的测量数据、测定参数以及受验者属性数据经由数据中心200内的通信接口202被累积并保存在存储装置210中。并且,计算处理系统300构成为经由通信接口204访问存储装置210内的数据。

图5是数据处理部32的硬件框图。作为数据处理部32的硬件,如上述那样,虽然没有特别限定,但是能够使用通用计算机。

在图5中,数据处理部32的计算机主体2010除了包括存储器驱动器2020、磁盘驱动器2030以外,还包括运算装置(CPU)2040、与磁盘驱动器2030及存储器驱动器2020连接的总线2050、用于存储启动程序等程序的ROM 2060、用于临时存储应用程序的命令并且提供临时存储空间的RAM 2070、用于存储应用程序、系统程序及数据的非易失性存储装置2080、以及通信接口2090。通信接口2090相当于用于与驱动部21等进行信号的发送接收的接口部44以及用于经由未图示的网络来与其它计算机进行通信的网络接口50。此外,作为非易失性存储装置2080,能够使用硬盘(HDD)以及固态硬盘(SSD:Solid State Drive)等。非易失性存储装置2080相当于存储部36。

CPU 2040通过基于程序执行的运算处理,来实现数据处理部32的各功能、例如控制部42、数据收集部46、图像处理部48的各功能。

用于使数据处理部32执行上述实施方式的功能的程序也可以被存储于CD-ROM2200或存储器介质2210中,通过插入到磁盘驱动器2030或存储器驱动器2020中来被进一步传输到非易失性存储装置2080。程序在执行时被加载到RAM 2070中。

数据处理部32还具备作为输入装置的键盘2100和鼠标2110、以及作为输出装置的显示器2120。键盘2100和鼠标2110相当于输入部40,显示器2120相当于显示部38。

用于使CPU 2040作为如上所述的数据处理部32来发挥功能的程序也可以不包括用于使计算机主体2010执行信息处理装置等的功能的操作系统(OS)。该程序只要仅包括使得以受到控制的方式调用适当的功能(模块)来获得期望的结果的命令的部分即可。数据处理部32如何进行动作是周知的,省略详细的说明。

另外,执行上述程序的计算机可以为单个,也可以为多个。即,可以进行集中处理,或者也可以进行分散处理。另外,计算处理系统300内的硬件虽然也可能存在使运算处理装置并行化、或者使用GPGPU(General-purpose computing on graphics processingunits:通用计算图形处理单元)等结构上的差异,但是基本结构与图5所示的结构是相同的。

(脑活动生物标记物的协调化)

在收集与精神疾病相关联的大数据时,在一个地点收集大规模的脑图像数据(与人的疾病有关的连接组)几乎是不可能的。因而,需要从多个地点收集图像数据。

完全地控制MRI装置(扫描仪)的类型、协议以及患者部分是很难的。因而,在多数情况下,对所收集的数据进行解析要使用在不同条件下拍摄到的脑图像数据。

特别是,疾病因素存在与地点因素交织的倾向,因此在通过对这种不同条件下的数据应用机器学习技术来提取疾病因素的情况下,地点间差异成为最大的障碍。一个地点(或医院)往往采样很少的几种精神疾病(例如,从地点A主要采样精神分裂症,以及从地点B主要采样自闭症),因此产生交织。为了适当地管理这种不同条件下的数据,需要对地点间的数据进行协调(调和)。

地点间差异本质上包括两种类型的偏倚。是技术上的偏倚(也就是测定偏倚)和生物学上的偏倚(也就是抽样偏倚)。

测定偏倚包括拍摄参数、电场的强度、MRI装置制造商以及扫描仪的类型那样的MRI扫描仪的特性的差异。抽样偏倚与地点间的受验者组的差异进行关联。

下面,对用于独立于抽样偏倚地评价测定偏倚来协调测量数据的手法进行说明。

(多设施受检者法的协调化)

图6是用于说明本实施方式的rs-fcMRI法中在地点间移动来接受测量的移动受验者(下面为“多设施受检者”)的地点间差异的评价手法的概念图。如下面说明的那样,在本实施方式中,对能够使用多设施受检者的数据集来仅消除测定偏倚那样的协调化法进行说明。

参照图6,为了跨测量地点MS.1~Ms.Ns的地点地评价测定偏倚,而获取多设施受检者TS1(人数:Nts人)的数据集。健康的Nts名参加者的静息态脑活动设为在Ns个地点的各个地点处进行拍摄,Ns个地点设为包括拍摄到患者数据的全部地点。获取到的多设施受检者的数据集作为移动受验者数据被保存到数据中心200的存储装置210。而且,如后述那样,在计算处理系统300中执行用于“脑活动生物标记物的协调方法”的处理。多设施受检者的数据集只包括健康者组。另外,设为在全部的地点处参加者是相同的。因而,关于多设施受检者,地点间差异仅包含“测定偏倚”。

在下面说明的本实施方式的协调化法中,作为“脑活动生物标记物的协调方法”,对各测量地点处的测量数据进行以下处理:去除“测定偏倚”的影响来进行校正。

也就是说,下面,使用“统计建模”手法中的“一般线性混合模型(GLMM:Generalized Linear Mixed Model)”来评价“测定偏倚”和“抽样偏倚”。在此,GLM(Generalized Linear Model:一般线性模型)通常是嵌入有用于说明“响应变量”的概率分布的“说明变量”的模型。在GLM中主要存在“概率分布”、“链接函数”、“线性预测器”这三个部件,通过指定该部件的组合方式,能够表现出各种类型的数据。

并且,GLMM(一般线性混合模型)是能够嵌入通过GLM所无法说明的“人所无法测定/未测定过的个体差异等”的统计模型。关于GLMM,例如在对象由几个子集合(例如,测量场所不同的子集合)构成的情况下,也能够将该场所差异嵌入到模型中。换言之,称为将多个概率分布作为部件的(混合而成的)模型。

例如,关于GLMM,在下面的文献中有公开。将公知文献8的公开全部通过参照引用于此处。

公知文献8:久保拓弥著作、“データ解析のための統計モデリング入門(用于数据解析的统计建模入门)”、岩波书店、2012年第1版、2017年第14版

其中,在下面说明的本实施方式的统计模型中,通常是,对于被称为“效应”的“偏倚”和“因素(factor)”这样的术语,“偏倚”使用为“测定偏倚”和“抽样偏倚”,“因素(factor)”使用为其它因素(受验者因素或疾病因素)。

而且,下面的解析与单纯的GLMM的流程不同,不区分为“固定效应”和“随机效应”而进行因素的解析。这是由于,通常当使用GLMM时,关于随机效应仅估计方差,不知道各因素的效应的大小。因此,下面,为了评价各因素的效应的大小,对于各因素,如下面那样变换变量来进行估计以成为平均为0的固定效应。

i)将各地点的测定偏倚定义为与全部地点处的各个功能连接性的相关值的平均之间的偏差。

ii)假定为健康者和精神疾病患者的抽样偏倚互不相同。因而,对于健康者组和具有各疾病的患者组,独立地计算各地点的抽样偏倚。

iii)疾病因素被定义为与健康组的值之间的偏差。

即,下面,针对包括患者在内的数据集以及多设施受检者的数据集,如下面那样应用一般线性混合效应模型。

多设施受检者为Nts人,将Ns个测量地点中的进行了健康者的测量的地点数设为Nsh个,将进行了某种疾病(此处用后缀“dis”表现)的患者的测量的地点的个数设为Nsd个。

通过使回归模型拟合患者的测量结果的数据集以及多设施受检者的数据集中的所有参加者的功能连接性的相关值来评价参加者因素(p)、测定偏倚(m)、抽样偏倚(Shc,Sdis)以及精神疾病因素(d)。

下面,向量用小写字母(例如m)表示,假定向量全部为列向量。向量元素如m

由脑区域间的n个相关值构成的功能连接性向量(设为列向量)的回归模型表示为下面的式子。

[数1]

Connectivity=xm

为了表示参加者的特性,而使用1-of-K(哑编码)的二进制代码体系,对于属于地点k的测定偏倚m而言的目标向量(例如xm)除了等于1的元素k以外全部等于零。如果参加者不属于任何类别(健康者、患者、多设施受检者),则目标向量为所有元素都等于0的向量。

上角标T表示矩阵或向量的置换,x

在此,m表示测定偏倚(Ns×1的列向量),shc表示健康组的抽样偏倚(Nsh×1的列向量),sdis表示患者的抽样偏倚(Nsd×1的列向量),d表示疾病因素(将2×1的列向量、健康以及疾病作为元素),p表示参加者因素(Nts×1的列向量),const表示涉及来自全部测量地点的全部参加者(包括健康者、患者、多设施受检者)的功能连接性的平均,e~N(0,γ-

此外,在此,设为为了简化说明而疾病的种类为一种来进行说明。疾病的种类存在多种的情况在后面记述。

对于各功能连接性的相关值,由于回归模型的设计阵列不满秩,因此使用基于L2归一化的最小二乘回归,来评价各个参数。此外,除了基于L2归一化的最小二乘回归法以外,例如还能够使用贝叶斯估计法等其它评价方法。

在如上所述的回归计算之后,受验者a的第b个连接性能够如下那样描述:

[数2]

图7是用于说明受验者a的第b个功能连接性的表现的概念图。在图7中,示出了第一项和第二项的目标向量的意义以及测定偏倚向量和健康者的抽样偏倚向量。第三项以后也是同样的。

图8是说明根据图2所说明的相关阵列生成作为生物标记物的判别器的过程的概念图。

如图5所示,对于各个受验者,计算处理系统300根据对健康组、患者组测定出的静息态功能连接的MRI的数据来导出脑区域间(关心区域间)的活动度的相关阵列。接着,关于相关阵列的非对角成分,如后述那样事先导出对应的测定偏倚,通过将相关阵列的元素的值减去该测定偏倚来执行协调化处理。并且,在进行协调化处理后的相关阵列的元素值与关于各受验者的疾病标签(表示疾病或健康的标签)之间,抑制过度学习,计算伴有特征选择的判别模型(例如实施正则化逻辑回归),来生成判别器。

图9和图10是用于说明基于数据中心200的存储装置210中保存的数据来执行协调化处理、判别器生成处理、判别处理的计算处理系统300的结构的功能框图。

也如图5中所说明的那样,计算处理系统300具有与图5所示的结构同等的硬件结构。因此,下面,关于计算处理系统300内的硬件部分,对图5中的对应的标记附加“'”来进行说明。

参照图9,计算处理系统300包括:存储装置2080′,其用于保持来自存储装置210的数据和在计算中途生成的数据;以及运算装置2040′,其对存储装置2080′内的数据执行运算处理。作为运算装置2040′,例如CPU适当。

运算装置2040′包括:相关阵列计算部3002,其通过执行程序来针对患者组和健康组的MRI测量数据3102计算相关阵列的元素,并将相关阵列的元素作为相关阵列数据3106保存到存储装置2080′中;协调化计算部3020,其执行协调化处理;以及判别处理部3000,其基于协调化处理的结果,来执行判别器的生成处理和所生成的判别器的判别处理。

图10是更详细地说明图9的结构的功能框图,图11是用于说明协调化处理的流程图。参照图10和图11,首先,在数据中心200的存储装置210中,从各测量地点收集了受验者(健康者和患者)的fMRI测量数据、受验者的属性数据、测定参数(图11的S102)。

接着,虽然没有特别限定,但是例如以规定的周期(例如以1年为周期)巡回于各测量地点来测量多设施受检者TS1的脑活动,在数据中心200的存储装置210中,从各测量地点收集了多设施受检者的fMRI测量数据、受验者的属性数据、测定参数(图11的S104)。

协调化计算部3020通过使用如上所述的GLMM(一般线性混合模型),来对功能连接性评价各测量地点的测定偏倚(图11的S106)。

协调化计算部3020将通过这样计算出的各测量地点的测定偏倚作为测定偏倚数据3108保存到存储装置2080中(图11的S108)。

(判别器生成处理)

图12是示出图10所示的判别处理部3000生成关于受验者的疾病或健康标签的判别器的处理的流程图。这种判别器(或分类器)提供用于对受验者进行诊断的辅助信息(援助信息)。

参照图10和图12,相关值校正处理部3004读出存储装置2080′中保存的各测量地点的测定偏倚数据3108(图12的S202),如下面的式子那样对成为用于生成判别器的机器学习的训练对象的各受验者的相关阵列的非对角成分执行协调化处理。

[数3]

在此,功能连接性Connectivity表示协调化前的功能连接性向量,Csub表示协调化后的功能连接性向量。另外,m(帽子)(下面,将在字母x的头部带有^表述为“x(帽子)”)表示通过如上所述的基于L2归一化的最小二乘回归进行了评价的测量地点处的测定偏倚。由此,将功能连接性Connectivity减去与被测量出功能连接性Connectivity的测量地点对应的测定偏倚来接受协调化处理(图12的S204)。执行校正处理后的数据作为校正后相关值数据3110而被保存到存储装置2080′中。

此外,也如下面的文献中记载的那样,假定为疾病因素并非与整个大脑的连接性有关,而是与连接性的特定子集合有关。将下面的公知文献9的公开全部通过参照引用于此处。

公知文献9:Yahata N,et al.A small number of abnormal brain connectionspredicts adult autism spectrum disorder(少量异常的大脑连接预测成人自闭症谱系障碍).Nat Commun 7,11254(2016).

因此,接着,通过判别器生成部3008对包括关于受验者的疾病/健康标签的受验者的疾病标签和校正处理后的功能连接性执行用于特征选择的正则化逻辑回归来生成判别器(图12的S206)。

首先,逻辑函数被用于如下面那样定义参加者属于疾病类别的概率。

[数4]

在此,ysub是参加者的类别标签(在诊断标签为“疾病”时y=1,在诊断标签为“健康者”时y=0),w表示权重向量。

作为正则化逻辑回归,能够实施使用基于L1正则化的LASSO(least absoluteshrinkage and selection operator:最小绝对收缩与选择算子)的逻辑回归分析,从如上所述的35,778个连接中选择功能连接性最佳的子集合。

即,在此,权重向量w被决定为使下面的函数J最小化。

[数5]

在此,nsub是用于生成判别器的受验者数,λ表示对评价中应用的缩小量进行控制的超参数。

此外,作为用于抑制过度学习来执行特征选择和模型化的手法,不限定于利用LASSO的正则化逻辑回归,例如也可以使用如下面的文献中公开的稀疏逻辑回归、或其它的稀疏贝叶斯估计法等其它手法。将下面的公知文献10的公开全部通过参照引用于此处。

公知文献10:Okito Yamashita,Masaaki Sato,Taku Yoshioka,Frank Tong,andYukiyasu Kamitani.“Sparse Estimation automatically selects voxels relevantfor the decoding of fMRI activity patterns(稀疏估计自动选择与fMRI活动模式解码相关的体素).”NeuroImage,Vol.42,No.4,pp.1414-1429,2008.

根据以上内容,生成对于疾病的判别器(作为脑活动生物标记物的分类器而发挥功能),判别器生成部3008将用于确定判别器的信息作为判别器数据3112保存到存储装置2080′中(图12的S208)。

此外,例如,判别器的分类性能能够使用训练数据来通过交叉验证的过程进行评价。

以上那样的处理如上述那样没有特别限定,但是可以设为每隔规定的期间(例如1年)进行实施。

而且,在某一个测量地点处新执行了关于一名受验者的功能连接性的测量的情况下,能够假定为该测量地点的测定偏倚在规定期间内是固定的,因此判别值计算部3010将输入的关于该受验者的输入数据的相关阵列的元素的值减去在上述的过程中已经计算出的与被测量出该输入数据的测量地点对应的“测定偏倚”,由此执行协调化处理。而且,通过上述的过程,由已经在图12的过程中制作出的“判别器”输出关于该受验者的判别标签来作为判别结果。

判别结果可以是表示“疾病”、“健康”这二者中的某一个的值,或者也可以是表示“疾病”、“健康”中的至少一方的概率的值。

此外,在判别值计算部3010实施的判别处理时,作为被输入的“输入数据”,可以是表示受验者的脑功能活动的MRI测量数据本身,或者也可以是相关值本身的数据,该相关值是在各测量地点处根据表示受验者的脑功能活动的MRI测量数据计算出相关阵列的值之后的相关阵列的非对角元素。

(追加了新的测量地点的情况下的协调化计算处理)

图13是用于说明在通过图6中所说明的过程执行了协调化处理之后追加了新的测量地点的情况下的协调化处理的概念图。参照图13,在新增加了第(Ns+1)个测量地点MS.Ns+1的情况下,重新使多设施受检者TS1再巡回于该(Ns+1)个测量地点的全部来进行与上述的协调化计算处理同样的过程,能够重新计算测定偏倚。

通过执行以上说明的第一实施方式那样的处理的系统,能够对在多个设施处测量的大脑的活动的测量数据调整和校正各设施处的测定偏倚。由此,能够基于多个设施处的测量数据来调整脑功能连接相关值。

另外,根据执行第一实施方式那样的处理的系统,能够实现能够协调在多个设施处测量出的大脑的活动的测量数据来提供用于客观地判断健康或疾病的状态的数据的脑活动分类器的协调方法、脑活动分类器的协调系统、脑活动解析系统以及脑活动解析方法。

或者,根据执行第一实施方式那样的处理的系统,能够实现对于在多个设施处测量出的大脑的活动的测量数据的、关于神经/精神疾病的基于脑功能图像法的生物标记物装置、生物标记物装置的程序。

[第一实施方式的变形例]

此外,在以上的说明中,以在各测量地点处获取了下面的受验者的数据为前提来对协调化计算处理进行了说明。

i)患者的数据

ii)健康者的数据

iii)多设施受检者的数据

其中,如果只是以上述的“测定偏倚”的评价为目的,则也可以设为通过GLMM(一般线性混合模型)基于对多设施受检者测量出的数据来评价“测定偏倚”。

即,设为多设施受检者为Nts人。通过使回归模型拟合多设施受检者的数据集中的全部参加者的功能连接性的相关值来评价参加者因素(p)、测定偏倚(m)。在此也是,向量用小写字母(例如m)表示,假定向量全部为列向量。向量的元素如m

由脑区域间的n个相关值构成的功能连接性向量(设为列向量)的回归模型表示为下面的式子。

[数6]

Connectivity=x

为了表示参加者的特性,而使用1-of-K(哑编码)的二进制代码体系,对于属于地点k的测定偏倚m而言的目标向量(例如xm)除了等于1的元素k以外全部等于零。

上角标T表示矩阵或向量的转置,x

通过以上那样的结构,也能够设为计算“测定偏倚”来执行协调化处理的结构。

作为第一实施方式的手法与第一实施方式的变形例的手法的不同点,在如第一实施方式的变形例的手法那样仅使用多设施受检者的情况下,能够列举具有可以不考虑抽样偏倚这样的优点。另一方面,如第一实施方式的手法那样包括患者的数据和健康者的数据双方是具有估计所使用的数据数量变多这样的优点。因而,可以说因不考虑抽样偏倚而产生的测定偏倚的估计精度的提高与因数据数量多而产生的测定偏倚的估计精度的提高具有相互折衷的关系。

因此,虽然没有特别限定,但是例如也能够通过实验来使在现实的运用中在各测量地点处使用的参加者(患者和健康者)的数据数量优化。在该情况下,虽然没有特别限定,但是也可以设为事先分配从各测量地点提取的参加者的人数,在各测量地点处随机地提取该人数量的数据。

[实际的脑活动测量结果的数据及其解析]

下面,说明对实际公开的多疾病数据库的数据执行如上所述的协调化处理而得到的结果。

图14是示出协调化处理中使用的多疾病数据库的数据和多设施受检者的数据集的概念图。如图14的(a)所示,使用作为脑科学战略研究计划(SRPBS:Strategic ResearchProgram for Brain Sciences)中的多疾病数据库(https://bicr-resource.atr.jp/decnefpro/)而公开的数据的患者组和健康组的数据集。

作为多疾病数据集,在多个测量地点(在图14中,典型地示出地点1、地点2、地点3)处测量出的数据包含关于精神疾病患者的采样偏倚、关于健康者的采样偏倚以及测定偏倚来作为地点间差异。

另一方面,如图14的(b)所示,作为关于多设施受检者的数据集,在多个测量地点(在图14中,典型地示出地点1、地点2、地点3)处测量出的数据仅包含测定偏倚来作为地点间差异。

能够通过数据集的同时分析来将地点间差异分割为测定偏倚和抽样偏倚,将测定偏倚和抽样偏倚在静息态的功能连接性上的效应大小与精神疾病的效应大小进行定量比较。

关于测定偏倚,针对不同的拍摄参数、MRI装置制造商以及各MRI扫描仪中的接收线圈的数量,定量比较了效应的大小。并且,还研究了与机制的根本性的“抽样偏倚”有关的两个备择假设:

第一假设是假定为对地点分别相同的总体中的受验者进行采样。在该状况中,抽样偏倚是由于对受验者的随意提取而产生的,这归结于地点间的患者的特性的偶然差异。

第二假设是假定为对地点各不相同的子总体中的受验者进行采样。在该状况中,抽样偏倚是由于从具备不同特性的子总体中进行采样而产生的。

例如,假定为在多个地点计划从重性抑郁障碍的患者相同的总体收集数据。在非典型抑郁症和忧郁症性抑郁症那样的总体内存在重性抑郁障碍的亚型。因而,存在如下的可能性:一个子总体包含多个非典型抑郁症的患者,另一方面,其它的子总体包含多个忧郁症性抑郁症的患者。因而,在几个实例中,可能是,非典型抑郁症在地点A的患者中出现的频度更高,另一方面,忧郁症性抑郁症在地点B的患者中出现的频度更高。

用于收集大规模数据集的基本协议在这两个假设之间是不同的。因而,需要决定最适当地反映SRPBS数据集的特性的假设。

在前者的假设下,即使是少量的地点,也只是需要从多个受验者收集数据。在后者的假设下,为了真正获得代表性的数据,需要从多个地点获取数据。

为了克服与地点间差异相关联的这些限制,使用多设施受检者的数据集来执行能够仅消除测定偏倚那样的协调化法。

基于通过新提出的方法和已有的方法协调后的多个地点的静息态的功能连接MRI数据,构建出受验者的信息(属性)(例如年龄)的回归模型和精神疾病的生物标记物。

对这些预测模型的性能基于协调化的方法如何变化进行了调查。

(所使用的数据集)

使用了如下的三个静息态的功能MRI数据集:

(1)SRPBS的多个疾病的数据集;

(2)19位多设施受检者数据集;以及

(3)独立的验证用数据集。

(SRPBS的多疾病的数据集)图15是示出SRPBS的多疾病数据集的内容的图。在9个地点处诊察得到的包括5种不同的疾病患者和健康的对照组(HC)的该数据集包含有下面的共805名参加者的数据:来自9个地点的482名健康者;来自5个地点的161名重性抑郁症(MDD)患者;来自1个地点的49名自闭症(ASD)患者;来自1个地点的65名强迫症(OCD)患者;以及来自3个地点的48名精神分裂症(SCZ)患者。

图16是示出各测量地点处的拍摄协议的图。静息态的功能MRI数据是在3个地点以外的所有地点处使用进行了统一的拍摄协议而得到的。(http://www.cns.atr.jp/rs-fmri-protocol-2/)

该数据集的地点间差异包含有测定偏倚和抽样偏倚双方。关于偏倚评价,仅使用了使用统一协议获得的数据。此外,由于使用该统一协议没有扫描出OCD患者,因此没有对OCD进行疾病因素的评价。

表中的简写符号如下。

ATT:国际电气通信基础技术研究所的西门子TimTrio扫描仪;

ATV:国际电气通信基础技术研究所的西门子Verio扫描仪;

KUT:京都大学的西门子TimTrio扫描仪;

SWA:昭和大学;

HUH:广岛大学医院;

HKH:广岛梶川(Kajikawa)医院;

COI:COI(广岛大学);

KPM:京都府立医科大学;

UTO:东京大学;

ASD:自闭症障害。

MDD:重性抑郁障碍

OCD:强迫症。

SCZ:精神分裂症

SIE:西门子fMRI装置。

GE:GE fMRI装置。

PHI:飞利浦fMRI装置。

(多设施受检者的数据集)

为了跨SRPBS数据集中的测量地点地评价测定偏倚,而获取了多设施受检者的数据集。

健康的9名参加者(全部为男性;年龄层:24岁-32岁;平均年龄:27±2.6岁)在12个地点处分别被拍摄,在12个地点中包含有拍摄到SRPBS数据集的9个地点,被实施了共411个操作。

虽然尝试了使用与SRPBS的多个疾病的数据集相同的拍摄协议来获得该数据集,但是由于各地点的参数设置或常规的扫描条件的限制,而地点之间的拍摄协议存在一些差异。例如,存在两个相位编码方式的方向(P→A和A→P)、3个MRI制造商(西门子、GE以及飞利浦)、4种线圈通道数(8、12、24以及32)以及7种扫描仪类型(TimTrio、Verio、Skyra、光谱、MR750W、SignaHDxt以及Achieva)这样的差异。

由于在12个地点处对相同的9名参加者进行了拍摄,因此该数据集的地点间差异仅包含测定偏倚。

(独立的验证数据集)

为了验证基于静息态的功能连接MRI数据来预测精神疾病的分类器和参加者的年龄的模型的通用化性能,而获取了覆盖2种疾病以及7个地点的独立的验证队列的数据。在该数据中包含有共625名参加者。即,获取了来自6个地点的476名健康组(HCs)、来自2个地点的93名MDD的患者、以及来自1个地点的56名SCZ的患者的数据。

(地点间差异和疾病效应的视觉化)

首先,通过主成分分析(PCA:principal component analysis)将SRPBS的多个疾病的静息态的功能连接MRI数据集中的地点间差异和疾病效应进行了视觉化。图17是示出使通过这种主成分分析得到的地点间差异和疾病效应视觉化的图表。此处的主成分分析相当于基于无监督学习的维数约减手法。

受验者的功能连接性如上述那样被计算为依赖于各参加者的两个脑区域间的静息态的功能MRI的血中氧浓度的、(BOLD)信号的时间上的相关性(使用皮尔逊相关系数)。

基于由覆盖整个大脑的268个节点(也就是脑区域)构成的功能大脑地图来定义功能连接性。

使用表示功能连接的相关性的矩阵的下三角阵列的35,778个(也就是说(268×267)/2)的连接强度(连接性)的值。

如图17所示,SRPBS的多个疾病的数据集中的参加者的数据全部被绘制在由最初的两个主成分构成的两个轴上。即,SRPBS的多个疾病的数据集的全部参加者以通过小的浅色标记来表示的方式被投射到最初的两个主成分(PC)中。各地点的全部的健康的对照组间的平均以及各精神疾病内的平均通过深色标记来表示。标记的颜色表示地点,形状表示精神疾病。

对于主成分1,HUH地点清楚地分离开,这是说明数据中的大部分方差的情形。ASD的患者仅在SWA地点处被扫描出。因而,该地点处扫描出的ASD(▲)患者和健康组HC(●)的平均被绘制在了几乎相同的位置。在图17中,示出多个疾病的数据集中的利用PCA的维数约减。

(偏倚评价)

为了定量地调查静息态的功能连接MRI数据的地点间差异,而确定出测定偏倚、抽样偏倚以及诊断的因素。如上所述,将各地点的测定偏倚定义为与全部地点处的各个功能连接性的相关值的平均之间的偏差。假定为健康者和精神疾病患者的抽样偏倚互不相同。因而,对于健康者组和具有各疾病的患者组,独立地计算出各地点的抽样偏倚。

疾病因素被定义为与健康组的值之间的偏差。由于是在多个地点处采样的患者组,因此对MDD和SCZ的患者进行了抽样偏倚的评价。由于使用统一协议没有扫描出OCD的患者,因此对MDD、SCZ以及ASD进行了疾病因素的评价。地点间的两种类型的偏倚同时变化,因此难以仅使用SRPBS的多个疾病的数据集来将地点间差异分离为测定偏倚和采样偏倚。

作为对照,在多设施受检者的数据集中,由于参加者是固定的,因此仅包含有测定偏倚。

通过将多设施受检者与SRPBS的多个疾病的数据集进行组合,由此作为因不同的地点而受到影响的不同的因素,同时对测定偏倚和采样偏倚进行了评价。为了评价两种偏倚和疾病的因素对功能连接性的效应,如下面那样利用了“线性混合效应模型”。

(对于SRPBS的多个疾病的数据集的线性混合效应模型)

在线性混合效应模型中,SRPBS的多个疾病的数据集中的各受验者的连接性的相关值由固定效应和随机效应构成。固定效应包含作为基线的涉及全部参加者和全部地点的平均相关值、以及测定偏倚、抽样偏倚及疾病因素之和。参加者的因素(也就是个人差异)以及扫描间的变化结合而产生的效应被视为随机效应。

(偏倚和因素的评价的详细内容)

通过使回归模型拟合SRPBS的多个疾病的数据集和多设施受检者的数据集中的全部参加者的功能连接性的相关值来对参加者因素(p)、测定偏倚(m)、抽样偏倚(shc、smdd、sscz)以及精神疾病因素(d)进行了评价。

在本例中,向量用小写字母的粗体(例如m)表示,假定向量全部为列向量。向量的元素如m

与上述同样地,为了表示参加者的特性,而使用1-of-K(哑编码)的二进制代码体系,对于属于地点k的测定偏倚m而言的目标向量(例如xm)除了等于1的元素k以外全部等于零。因而,如果参加者不属于任何类别,则目标向量为所有元素都等于0的向量。

上角标T表示矩阵或向量的转置,x

关于各连接性,回归模型能够如下面那样表示。

[数7]

Connectivity=x

其中,m表示测定偏倚(12个地点×1),shc表示健康组的抽样偏倚(6个地点×1),smdd表示MDD患者的抽样偏倚(3个地点×1),sscz表示SCZ患者的抽样偏倚(3个地点×1),d表示疾病因素(3种疾病×1),p表示参加者因素(9名多设施受检者×1),const表示涉及来自全部地点的全部参加者的功能连接性的平均,e~N(0,γ-

(对于多设施受检者的数据集的线性混合效应模型)

在对于多设施受检者的数据集的线性混合效应模型中,多设施受检者的数据集中对于特定扫描的各参加者的连接性的相关值包含固定效应和随机效应。固定效应包含涉及全部参加者和全部地点的平均相关值、参加者因素以及测定偏倚之和。扫描间的变化被视为随机效应。

对于各参加者,将参加者因素定义为脑功能连接性的相关值相对于涉及全部参加者的平均的偏差。

通过使上述的两个回归模型同时拟合两个不同的数据集的功能连接性的相关值,来对全部的偏倚和因素进行了评价。在该回归分析中,使用了来自SRPBS的多个疾病的数据集中使用统一的拍摄协议扫描出的参加者以及多设施受检者的数据集的全部参加者的数据。

总之,偏倚或各因素分别作为包含有反映连接性的相关值的数量(即,35,778个)的维数的向量被进行了评价。该进一步的分析中包含的向量是12个地点处的测定偏倚、6个地点处的HC的抽样偏倚、3个地点处的关于MDD患者的抽样偏倚、3个地点处的关于SCZ患者的抽样偏倚、9名多设施受检者的参加者因素、以及MDD、SCZ及ASD的诊断的因素。

(贡献大小的分析)

为了定量地确认因素间的大小关系,在线性混合效应模型中,计算贡献大小并进行比较,决定出各类型的偏倚和因素以何种程度对数据的方差进行说明。在拟合模型之后,来自受验者a的第b个连接性能够如下描述。

[数8]

例如,在该模型中,如下面那样计算出测定偏倚(也就是第一项)的贡献大小。

[数9]

在此,Nm表示各因素的元素的数量,N表示连接性的数量,Ns表示受验者的数量,Contribution size

这些式子被使用于对与测定偏倚(例如,相位编码方向、扫描仪、线圈以及fMRI制造商)有关的各个因素的贡献大小进行评价。特别是,将测定偏倚分解为这些因素,之后对关联的参数进行了评价。其它参数被固定为与在此以前评价过的参数相同的值。

从贡献大小的评价可以获知下面的内容。

1)测定偏倚对功能连接性的效应大小虽然表示出小于参加者因素的效应但是大部分大于疾病因素的效应,表明测定偏倚成为关于精神疾病的研究中重大的限制。

2)抽样偏倚中的最大的方差明显大于MDD因素的方差,抽样偏倚中的最小的方差为疾病因素的方差的二分之一。这表明抽样偏倚也成为关于精神疾病的研究中重大的限制。

3)参加者因素的标准偏差为SCZ、MDD以及ASD的疾病因素的标准偏差的约2倍。因而,在考虑全部的功能连接的情况下,健康者的总体内的个人的变动大于SCZ、MDD以及ASD的患者间的变动。

4)并且,测定偏倚的标准偏差大多大于疾病因素的标准偏差,另一方面,采样偏倚的标准偏差是与疾病因素的标准偏差相同的程度。这种关系性使得针对精神疾病或智力障碍开发基于静息态的功能连接MRI的分类器变得非常困难。仅在能够从大量的连接中选择数量非常少的疾病所特定的、或者测定地点所独立的异常的功能连接的情况下,能够关于多个地点生成鲁棒且能够通用的分类器。

(针对测定偏倚的分层聚类分析)

对于各地点k,计算测定偏倚mk(N×1,其中,N为功能连接性的个数)间的皮尔逊相关系数,基于涉及测定偏倚的相关系数进行了分层聚类分析。图18是基于分层聚类分析的树状图。树状图中的各链接(linkage)的高度表示通过该链接来连结的簇间的非相似性(1-r)。

在调查测定偏倚的特性时,针对12个地点调查了被评价的测定偏倚向量的相似性是否反映出相位编码的方向、MRI制造商、线圈类型以及扫描仪类型那样的MRI扫描仪的特定的特性。

为了发现对于测定偏倚的同样模式的簇,使用了分层聚类分析。其结果是,如图18所示,12个地点的测定偏倚在第一级被分割为相位编码的方向的簇。测定偏倚在第二级被分割为fMRI制造商的簇,进一步分割为线圈类型簇,而且分割为扫描仪型号簇。

图19是示出各因素的贡献大小的图。如图19所示,为了对各因素的贡献进行评价,通过使用相同的模型,来定量地确认因素的大小关系。

贡献大小具有如下的关系:相位编码方向(0.0391)是最大的,其次是fMRI制造商(0.0318)、线圈类型(0.0239)以及扫描仪型号(0.0152)。通过这些示出:对测定偏倚带来影响的主要因素是相位编码方向,其次是fMRI制造商、线圈类型以及扫描仪型号的差异。

(从子总体中采样而产生的抽样偏倚)

对如上所述的“抽样偏倚”的背景下的机制的两个可选模型进行了调查。图20是示出“抽样偏倚”的背景下的机制的概念图。

在图20的(A)所示的“单个总体的模型”中,假定从共同的总体中采样参加者。根据高斯分布来生成各参加者的功能连接性的相关值。

在图20的(B)所示的“不同的子总体的模型”中,假定由于在各地点处从不同的子总体中采样参加者的一部分而产生抽样偏倚。子总体的平均在地点间是不同的,根据高斯分布来生成子总体的平均。并且,在各地点处,基于子总体的平均,根据高斯分布来生成各参加者的功能连接性的相关值。

需要确定哪个模型更适合涉及多个地点地收集大数据。原因在于,如果前者的模型适合,则即使地点的数量少,获取到的数据也能够被使用于通过增加参加者的数量来表示总体。另一方面,如果后者的模型适合,则即使是非常大的样本量的情况也不能说一个地点就表示真实的整个总体分布,因此应该从很多的地点收集数据。

关于各模型,首先调查了各地点的参加者的数量如何决定功能连接性中的抽样偏倚的效应。基于对于涉及功能连接性的抽样偏倚的方差值,测定出效应的大小。虽然本质上并不存在基于使用哪个值所致的差异,但是为了使统计分析简单化,代替标准偏差而使用了方差。

在理论上,模型分别表示参加者的数量与抽样偏倚的方差之间的不同的关系性。因而,通过将修正后的赤池信息量基准(AICc)与贝叶斯信息量基准(BIC)进行比较,调查出哪个模型表示该数据中的实际的关系性。并且,对使用除了一个地点以外的全部的地点来生成模型并通过该模型对剩余的地点预测抽样偏倚的方差这样的预测性能进行了地点留一交叉验证。之后,将两个模型间的预测性能进行了比较。

从这些结果表示出,不同的子总体的模型比单个总体的模型更好地拟合该数据。(不同的子总体的模型:AICc=-108.80和BIC=-113.22;单个总体的模型:AICc=-96.71和BIC=-97.92)。并且,不同的子总体的模型的预测性能明显高于单个总体的模型的预测性能。(在应用于绝对误差的威尔科克森符号秩检验(Wilcoxon signed rank test)中,如下:p=0.0469、符号秩=19、n=6)

该结果表示:不只是通过从单个较大的总体中的随意提取而带来抽样偏倚,通过从不同的子总体中进行采样也会引起抽样偏倚。该结果表示:在想要基于从有限数量的地点和参加者得到的测定来进行健康对照组或患者的数据的真正的单个分布的评价的情况下抽样偏倚成为主要的限制。

(协调化效果的视觉化)

接着,使用多设施受检者的数据集来说明能够仅去除测定偏倚的协调化法。

如上所述,使用线性混合效应模型来独立于抽样偏倚地对测定偏倚进行了评价。通过该方法,能够从SRPBS的多个疾病的数据集中仅去除测定偏倚,能够维持包含有生物学信息的抽样偏倚。

(多设施受检者的协调化)

HKH地点处的相位编码方向在SRPBS的多个疾病的数据集与多设施受检者的数据集之间是不同的。因此,为了评价测定偏倚,下面设为在式中与测定偏倚分开地包含相位编码因素(pa

回归模型如下面那样。

[数10]

Connectivity=xm

在此,pa表示相位编码因素(两个相位编码方向×1)。

通过基于标准的LS归一化的最小二乘法回归对各功能连接性的相关值执行归一化后使用,来对参数分别进行了评价。地点间差异是通过减去被评价的地点间差异和相位编码因素而被去除。

因而,抽样偏倚被协调后的功能连接性的相关值如下。

[数11]

其中,m表示被评价了的测定偏倚,pa(帽子)表示被评价了的相位编码因素。

图21是使协调化过程的影响视觉化的图,是与图17进行对比的图。在图21中,在从SRPBS的多个疾病的数据集仅去除测定偏倚之后对数据进行了绘制。在图17中反映了协调化前的数据,与图17所示的数据进行比较,在图21中,HUH地点大幅移动为更接近原点侧(也就是总体的平均),并且不再大幅地远离其它地点。

图21所示的结果表示:如图17中看到的HUH地点的分离是由测定偏倚带来的,该分离能够通过协调化来被去除。

并且,协调化对于识别在相同的地点处扫描出的患者和健康者组也是有效的。ASD的患者仅在SWA地点被扫描到,因此在该地点处扫描到的ASD患者(▲)和健康者(○)的平均在图17中被绘制到了几乎相同的位置处。然而,在图21中,两个符号被相互明显地分离开。对于没有协调化的最初的两个PC,意味着虽然无法观察精神疾病(ASD)的影响,但是通过去除测定偏倚而变得能够探测到。

(针对MDD和SCZ的分类器)

为了定量地评价协调化法,以基于静息态的功能连接MRI数据来识别健康者组和患者为目的,使用SRPBS的多个疾病的数据集来构建精神疾病用生物标记物,并对用于从SRPBS的多个疾病数据集去除地点间差异的下面四种不同的协调化法进行了比较。

(1)通过使用线性混合效应模型将多设施受检者的数据集(也就是多设施受检者的方法)与SRPBS的多个疾病的数据集进行组合,由此与抽样偏倚分开地对测定偏倚进行了评价。

(2)通过ComBat法使用基因组学中一般使用的批次效应修正工具,将地点间差异模型化并去除。此外,关于ComBat法,例如在下面的文献中有公开。将下面的公知文献11的公开全部通过参照引用于此处。

公知文献11:Johnson WE,Li C,Rabinovic A,“Adjusting batch effects inmicroarray expression data using empirical Bayes methods(利用经验贝叶斯方法调整微阵列表达数据中的批次效应).”Biostatistics 8,118-127(2007).

(3)使用一般线性模型(GLM),仅使用SRPBS的多疾病数据集而不对生物学的协变量(例如诊断或年龄)进行调节,来对测定偏倚进行了评价(也就是GLM法)。关于GLM法,例如在下面的文献中有公开。将下面的公知文献12的公开全部通过参照引用于此处。

公知文献12:Fortin JP,et al.Harmonization of cortical thicknessmeasurements across scanners and sites(涉及扫描仪和地点的皮质厚度测量的协调).Neuroimage 167,104-120(2017).

(4)使用GLM法,仅使用SRPBS的多个疾病的数据集并对生物学的协变量进行调整来对测定偏倚进行了评价(也就是说,调整后的GLM方法)。关于该方法,也在上述的公知文献12中有公开。

并且,将这四个方法与非协调化法(原始数据状态的方法)进行了比较。

为了关注多个地点数据,将来自从多个地点采样到的患有MDD和SCZ的患者的数据作为目标。因此,为了构建各分类器,将机器学习技术应用于下面的两种情况。

(1)SRPBS的多个疾病的数据集中的针对健康者组和MDD患者的全部的功能连接性数据(来自5个地点的135名MDD患者、来自9个地点的425名健康者组)

(2)SRPBS的多个疾病的数据集中的针对健康者组和SCZ患者的全部的功能连接性数据(来自3个地点的44名SCZ患者、来自9个地点的425名健康者组)。

如上所述,实施使用用于特征选择的LASSO法的逻辑回归分析,来从35,778个连接中选择功能连接性最佳的子集合。

使用用于完全独立的验证队列的数据集的一部分来测试模型的通用化性能。图22是示出分类器对于MDD的分类性能的图。图23是示出分类器对于SCZ的分类性能的图。

在分类器的训练中,为了保证使用全部参加者的数据,重复进行了100次(也就是重采样)生成分类器的过程。这是由于,分类器性能的平均值可以说表示训练数据集中的分类器性能。

在图22和图23中,诊断标签表示疾病的概率超过0.5被认为提供用于对象为精神疾病的诊断的辅助信息(援助信息)。

如图22和图23的左侧的列所示,显然训练数据集中的诊断辅助信息的概率的分布是根据阈值0.5将精神疾病患者与健康清楚地分离开(各图表中的中央线)。

与此相对,如图22和图23的右侧的列所示,显然独立队列中的诊断辅助信息的概率的分布是仅对于多设施受检者法和ComBat法的方法,根据阈值0.5将精神疾病患者与健康组分离开。

因而,在独立的队列中,对于GLM法和调整GLM法观测到非常低的灵敏度(小于0.5)和过高的特异性,但是对于将原始数据直接使用于针对MDD和SCZ的分类器的方法,观察到中等程度的灵敏度(约0.5)和过高的特异性。这是:由于将患者与健康者未进行区分而分类成了健康者,因此观察到过高的特异性。该结果表示,GLM法和调整GLM法不能删除地点间差异,反倒是可能对分类带来负面影响。

图24是示出MDD分类器对于独立队列的性能的图。图25是示出SCZ分类器对于独立队列的性能的图。不重新调整分类器而直接研究了向独立队列的通用化。分类器输出被定义为参加者被分类到MDD或SCZ的类的概率。

在此,作为分类器的性能,使用了马修斯相关系数(MCC:Matthews correlationcoefficients)、关于ROC曲线(Receiver Operatorating Characteristic curve、接收者动作特性曲线)的ROC曲线下面积(AUC:area under the curve)、准确度(Accuracy)、灵敏度(Sensitivity)、特异性(Specificity)。

使用多设施受检者的数据集(也就是多设施受检者法)开发出协调化法。将所得到的协调化法与已有的协调化法进行比较的结果证实了:关于精神疾病的分类器的通用化性能以及如后述那样的用于预测参加者的年龄的回归模型的开发,多设施受检者法和ComBat法的性能优于基于其它以往的GLM法的协调化法的性能。

并且,可知:无法识别抽样偏倚和测定偏倚的基于GLM法的协调化法的通用化性能比直接使用未被针对地点协调数据的原始数据的方法的通用化性能更差。

ComBat法对于MDD分类器和后述的年龄的回归模型而言达成了最高的性能,但是对于SCZ分类器而言比直接使用原始数据的方法差。成为这样的结果表示可能是由于SCZ患者少(n=48),因此ComBat法无法明确地区分测定偏倚与目标属性的关联。

作为对照,多设施受检者的方法仅对测定偏倚进行协调,因此该方法的性能对于分类器和回归模型而言优于基于其它以往的GLM法的协调化法的性能。

(基于四种协调化法的参加者的年龄的回归模型)

为了进一步调查协调化法的有效性,与直接使用原始数据的方法同样地使用四种不同的协调化法来构建回归模型,以预测参加者的年龄,并将模型的预测性能进行了比较。

为了构建各回归模型,使用了将机器学习技术应用于来自健康者组的全部的功能连接性数据而得到的(来自9个地点的425名健康者)的数据。使用LASSO法来应用线性回归,从共35,778个连接性中选择出功能连接性最佳的子集合。使用十折交叉验证的过程来在训练数据集中对预测性能进行了评价。

使用从ATR TimTrio、ATR Verio以及ATR Prisma地点(223名HC)获得的完全独立的验证队列数据集的一部分来调查了模型的通用化性能。不重新调整模型而研究了向独立队列的通用化。

图26和图27是示出独立的队列中的实际年龄和预测出的年龄的散布图的图。在这些图中,实线表示实际年龄相对于预测出的年龄的线性回归。在各图表中示出平均绝对误差(MAE:Mean Absolute Error)和相关系数(r)。各数据点表示一名参加者。图26的(A)表示对于多设施受检者法的结果,图26的(B)表示对于ComBat法的结果。

图27的(A)表示对于GLM方法的结果,图27的(B)表示对于调整GLM方法的结果,图27的(C)表示对于直接使用原始数据的方法(也就是说,没有以跨地点的方式对数据进行调和)的结果。

如图26所示,ComBat法达成了最低的平均绝对误差(MAE)值和最高的r值,但是多设施受检者法达成了第二低的MAE值和第二高的r值。并且,ComBat法和多设施受检者法的MAE值显然低于直接使用原始数据的方法的MAE值(两侧配对t-检验;ComBat:p=3.1×10-20、t=-10.18、df=222;多设施受检者:p=6.3×10-8、t=-5.5、df=222)。

这些结果表示:关于通用化性能,ComBat法和多设施受检者法的性能优于为了预测参加者的年龄而构建回归模型的其它协调化法的性能。

根据以上的结果,无论是从通用化性能的观点出发,还是能够普遍应用于对更多属性的分类这一点上,作为对于多个设施处的测量数据的协调化方法,多设施受检者法都是比其它方法更优秀的方法。

[第二实施方式]

在第一实施方式中,作为通过脑活动测量装置(fMRI装置)测量在多个测定场所处测量出的脑活动数据并基于该脑活动数据来进行生物标记物的生成以及利用生物标记物对诊断标签的估计(预测)的结构,说明了通过方差处理来进行的一例的结构。

但是,也能够设为将下面的处理分别分散于不同的设施中来执行的结构。

i)用于通过机器学习来训练生物标记物的脑活动数据的测量(数据收集),

ii)通过机器学习生成生物标记物的生成处理以及利用生物标记物对特定的受验者进行的诊断标签的估计(预测)的处理(估计处理),以及

iii)关于上述特定的受验者的脑活动数据的测量(对象者的脑活动测量)。

图28是示出分散地进行数据收集、估计处理以及对象者的脑活动测量的情况下的一例的功能框图。

参照图28,地点100.1~100.N是通过脑活动测量装置来测量患者组、健康者组的数据的设施,管理服务器200′对来自地点100.1~100.Ns的测量数据进行管理。

计算处理系统300根据服务器200′中保存的数据来生成判别器。

另外,设为计算处理系统300的协调化计算部3020将地点100.1~100.Ns以及MRI测量装置410的地点包含在内来执行协调化处理。

MRI装置410设置于利用计算处理系统300上的判别器的结果的其它地点处,对特定的受验者测量脑活动的数据。

计算机400设置于MRI装置410被设置的其它地点处,根据MRI装置410的测定数据来计算特定受验者的大脑的功能连接的相关数据,将功能连接的相关数据发送到计算处理系统300,并利用返回来的判别器的结果。

服务器200′保存从地点100.1~100.Ns发送来的患者组和健康者组的MRI测量数据3102、以及与MRI测量数据3102相关联的受验者的人属性信息3104,按照由计算处理系统300进行的访问,来将这些数据发送到计算处理系统300。

计算处理系统300经由通信接口2090接收来自服务器200的MRI测量数据3102和受验者的人属性信息3104。

此外,服务器200′、计算处理系统300、计算机400的硬件的结构基本上与图5中所说明的“数据处理部32”的结构相同,因此不重复进行该说明。

返回到图28,关于相关阵列计算部3002、相关值校正处理部3004、判别器生成部3008及判别值计算部3010、以及功能连接的相关阵列的数据3106、测定偏倚数据3108、校正后相关值数据3110及判别器数据3112,与第一实施方式中所说明的相同,因此不重复进行该说明。

MRI装置410测量成为诊断标签的估计对象的受验者的脑活动数据,计算机400的处理装置4040将测量出的MRI测量数据4102保存到非易失性存储装置4100中。

并且,计算机400的处理装置4040基于MRI测量数据4102,来与相关阵列计算部3002同样地计算功能连接的相关阵列的数据4106,并保存到非易失性存储装置4100中。

由计算机400的用户指定成为诊断对象的疾病,按照该用户的发送的指示,计算机400将功能连接的相关阵列的数据4106发送到计算处理系统300。响应于该发送,计算处理系统300执行与MRI装置410被设置的地点对应的协调化处理。判别值计算部3010计算关于所指定的诊断标签的判别结果。计算处理系统300经由通信接口2090将判别结果发送到计算机400。

计算机400经由未图示的显示装置等向用户通知判别结果。

通过设为这样的结构,能够基于对更多的受验者收集到的数据,来提供由判别器得到的诊断标签的估计结果。

另外,也能够设为由单独的管理者来管理服务器200和计算处理系统300的方式。在该情况下,通过对能够访问服务器200的计算机进行限制,也能够提高服务器200中保存的受验者的信息的安全性。

并且,当从计算处理系统300的运营主体来看时,即使对于“接受判别器进行判别的服务的侧(计算机400)”不提供任何关于判别器的信息或与“测定偏倚”有关的信息,也能够进行“提供判别结果的服务”。

此外,在以上的第一实施方式和第二实施方式的说明中,作为用于利用脑功能图像法来按时间序列测量脑活动的脑活动检测装置,设为使用实时fMRI进行了说明。但是,作为脑活动检测装置,能够使用上述的fMRI、脑磁图仪、近红外光测量装置(NIRS)、脑电图仪、或它们的组合。例如,在使用它们的组合的情况下,fMRI和NIRS检测与脑内的血流变化相关联的信号,具有高空间分辨率。另一方面,脑磁图仪和脑电图仪具有为了检测与脑活动相伴的电磁场的变化而具有高时间分辨率的特征。因而,例如,如果将fMRI与脑磁图仪组合,则在空间上和时间上都能够高分辨率地测量脑活动。或者,即使将NIRS与脑电图仪组合,也同样能够以小型且能够携带的大小来构成在空间上和时间上都能够高分辨率地测量脑活动的系统。

通过以上那样的结构,对于神经/精神疾病,能够实现作为基于脑功能图像法的生物标记物来发挥功能的脑活动解析装置和脑活动解析方法。

另外,在以上的说明中,说明了下面的例子:关于包含“诊断标签”来作为受验者的属性的情况,通过机器学习生成判别器来使该判别器作为生物标记物发挥功能。但是,本发明不必限定于这种情况。只要是将作为用于获得成为机器学习对象的测定结果的对象的受验者组事先通过客观的方法划分为多个类,并测定受验者的脑区域间(关心区域间)的活动度的相关性(连接),通过对测定结果进行机器学习,能够生成对于类的判别器即可,也可以使用于其它的判别。

另外,如上所述,这样的判别也可以将属于某属性的可能性显示为概率。

因而,例如采用某“训练”或“行动模式”能够客观地评价是否有助于增进受验者的健康。另外,实际上,即使是没有患上疾病的状态(“尚未患病”),也能够客观地评价某些“食物”、“饮料”等那样的摄取物以及某些活动等对于更接近健康状态是否有效。

另外,在尚未患病的状态中,也能够如上述那样,例如只要输出“健康的概率为XX%”那样的显示,则能够将健康状态作为客观的数值显示给用户。此时,输出的不一定是概率,也可以设为显示将“健康程度的连续值、例如健康的概率”转换为得分后的值。通过进行这种显示,也能够将本实施方式的装置除了使用于诊断的辅助以外,还使用为用于用户的健康管理的装置。

[第三实施方式]

在以上的说明中,构成为通过多设施受检者同等地移动于全部的测量地点进行测量来评价测定偏倚。

图29示出第三实施方式的多设施受检者的巡回方式的图。在本第三实施方式中,如图29所示,以多设施受检者TS1巡回于作为据点的“据点测量地点MS.1~MS.Ns”为前提。

例如,关于这些据点测量地点MS.1~MS.Ns中的据点测量地点MS.2,设为存在成为下级的MS2.1~MS2.n。在该据点测量地点MS.2的下级中新追加了“测量地点MS.2.n+1”的情况下,多设施受检者TS2巡回于该下级的范围。其它的据点测量地点也是同样的。

即,也能够设为如下结构:据点测量地点MS.2的测定偏倚固定为对多设施受检者TS1评价得到的值,关于测量地点MS.2、MS2.1、MS2.n、MS2.n+1,基于多设施受检者TS2巡回得到的测量结果来决定测定偏倚。

例如,假设“据点测量地点MS.1~MS.Ns”存在于预先决定的各地域,也考虑设为如下结构:在日本内的北海道、东北、关东、···、关西、···九州那样的各地域各设置有一处,下级地点例如为位于该地域之一的关西的测量地点。

或者,“据点测量地点MS.1~MS.Ns”也可以按预先决定的MRI装置的类型来决定。在该情况下,下级的测量地点是指设置有与据点地点相同类型的MRI装置的测量地点。

或者,“据点测量地点MS.1~MS.Ns”也可以按预先决定的地域且按所决定出的MRI装置的类型来决定。在该情况下,下级的测量地点是指在与据点地点相同的地域内设置有相同类型的MRI装置的测量地点。

这样的结构也能够起到与第一实施方式同样的效果。

[第四实施方式]

下面,以精神疾病中的重性抑郁障碍为例、即以医生通过以往的基于症状的诊断手法诊断为重性抑郁障碍的患者组为例来说明生成分类器的处理。即,说明图10或图28所示的判别器生成部3008为了生成输出用于判别患者组和健康组的诊断的辅助信息那样的分类器而执行的处理的其它例子。

下面,说明基于功能连接FC来构建用于识别健康组(HC)和MDD患者的MDD分类器的过程。为了确定与MDD诊断有关的功能连接FC,还研究了哪个功能连接FC对于分类器的构建是重要的。

并且,下面,针对贝克抑郁自评量表II构建回归模型。贝克抑郁自评量表(BDI)II是对于抑郁症状的严重程度的测定使用最广的测试之一。而且,研究对于回归模型而言哪个功能连接FC对于识别与抑郁症状组有关的FC是重要的。并且,研究与MDD诊断相关联的功能连接FC以及与抑郁症状有关的功能连接之间共通的静息态功能连接FC。

如已经记述的那样,关于使用机器学习算法的可靠的分类器和回归模型的构建,需要使用从大量的拍摄地点收集的大规模样本量的数据。因此,下面,使用从四个不同的拍摄地点收集的包含MDD患者的约700名参加者的学习用的静息态fMRI数据集进行研究。

图30是示出像这样的学习用的数据集(第一数据集)的人群特性的图。第一数据集是上述的SRPBS中的数据。图31是示出独立验证的数据集(第二数据集)的人群特性的图。第二数据集基本上也是上述的SRPBS中的数据。

即,在下面的分析中,使用下面的两个静息态功能的MRI(rs-fMRI)数据集。

(1)如图30所示,第一数据集包含有713名参加者的数据(来自4个地点的564人的健康组HC、来自3个地点的149人的MDD患者组)。

(2)如图31所示,第二数据集包含有449名参加者的数据(来自4个地点的264人的健康群HC、来自4个地点的185人的MDD患者组)。

另外,同时使用从各数据集的大部分参加者获得的贝克抑郁自评量表(BDI:BeckDepression Inventory)II来评价“抑郁症状”。

第一数据集是“学习用数据集”,被使用于构建MDD的分类器和BDI的直线回归模型。

参加者的测量分别是在10分钟的单个静息态功能的MRI(rs-fMRI)会话中执行的。

在此,也是在统一的拍摄协议下获取了静息态功能的MRI(rs-fMRI)数据(http://www.cns.atr.jp/rs-fmri-protocol-2/)。但是,与第一实施方式同样地,实际上很难保证在全部的地点处使用相同的参数进行了图像诊断,在测量中使用了两个相位调制方式的方向(P→A和A→P)、两个MRI装置制造商(西门子和GE)、三种不同的线圈数量(12、24、32)以及三个型号的扫描仪。

在静息态功能的MRI(rs-fMRI)的扫描中,原则上如下那样指示参加者。

“请放松。请保持清醒。请注视中央的十字线标记且不要思考具体的事情。”

数据集中的“人群特性”是所谓的“人口统计学”中使用的特性,除了包含年龄、性别等以外,还包含诊断名称那样的表中的属性。此外,在图30和图31中,括号中的人数表示具有BDI得分的数据的参加者的数量。人群分布在全部的学习用数据集中在MDD与HC的个体组间是一致的(p>0.05)。

第二数据集是“独立的验证数据集”,被使用于测试MDD的分类器和BDI的回归模型。拍摄得到第二数据集的地点不包含于第一数据集。

年龄的人群分布在独立的验证数据集中在MDD与HC的个体组间是一致的(p>0.05),但是性别的人群分布在独立的验证数据集中在MDD与HC的个体组间是不一致的(p<0.05)。

(静息态功能连接FC矩阵的预处理和计算)

数据的最初10秒由于考虑到T1平衡而被废弃。

在预处理的步骤中,实施时间层的校正、用于对头部能够观察到的身体运动伪像进行校正的重校准处理、脑功能图像(EPI图像)与形态图像的共配准(co-registration)、畸变校正、T1增强构造图像的分割、向蒙特利尔神经研究所(MNI)空间的归一化、以及使用6mm半值全宽的各向同性的高斯核进行的空间的平滑化等处理。

关于这种预处理的管线处理,例如在下面的站点中有公开。

http://fmriprep.readthedocs.io/en/latest/workflows.html

(脑区域的划分(分割:Parcellation))

关于脑区域的分割,为了通过人类连接组项目(HCP)型的“基于表面的方法”来分析数据,使用了如下面的站点中公开的工具箱(ciftify工具箱2.0.2版)。

https://edickie.github.io/ciftify/#/

该工具箱使得能够在类似HCP的基于表面的管线中对使用的数据(这些数据缺少HCP管线所需要的T2增强图像)进行分析。

而且,在下面的解析中,作为关心区域(ROI),使用下面的公知文献13中公开的379个基于表面的分区(皮层的360个分区+皮层下的19个分区)。将公知文献13的公开全部通过参照引用于此处。

公知文献13:Glasser,M.F.,Coalson,T.S.,Robinson,E.C.,Hacker,C.D.,Harwell,J.,Yacoub,E.,et al.(2016).A multi-modal parcellation of humancerebral cortex(人类大脑皮层的多模态分割).Nature 536(7615),171-178.doi:10.1038/nature18933.

从这些379个关心区域(ROI)提取BOLD信号的时间变化。

并且,通过使用如下面的公知文献14中公开的解剖学自动标记(AAL)以及Neurosynth(http://neurosynth.org/locations/),来确定重要的ROI的解剖学名称以及包含ROI在内的固有脑网络的名称。将公知文献14的公开全部通过参照引用于此处。

公知文献14:Tzourio-Mazoyer,N.,Landeau,B.,Papathanassiou,D.,Crivello,F.,Etard,O.,Delcroix,N.,et al.(2002).Automated anatomical labeling ofactivations in SPM using a macroscopic anatomical parcellation of the MNI MRIsingle-subject brain(使用MNI MRI单体脑的宏观解剖解析,对SPM中的激活进行自动解剖标记).Neuroimage 15(1),273-289.doi:10.1006/nimg.2001.0978.

(生理噪声回归)

生理噪声回归是应用下面的公知文献15中公开的CompCor来执行的。将公知文献15的公开全部通过参照引用于此处。

公知文献15:Behzadi,Y.,Restom,K.,Liau,J.,and Liu,T.T.(2007).Acomponentbased noise correction method(CompCor)for BOLD and perfusion based fMRI(基于BOLD和灌注的fMRI的基于分量的噪声校正方法(CompCor)).Neuroimage 37(1),90-101.doi:10.1016/j.neuroimage.2007.04.042.

为了去除一些杂散源(多余的信号源),使用了具备6个运动参数、全脑等回归总体参数的直线回归。

(时间滤波)

时间带通滤波器使用具备0.01Hz与0.08Hz之间的通带的巴特沃斯滤波器,对时间序列数据应用该时间带通滤波器,来将分析限定为作为BOLD活动的特性的低频的变动。

(头部运动)

在各个功能会话中计算框架位移(FD:Frame-wise displacement),为了减少因头部运动而引起的功能连接FC的杂散变化,去除FD>0.5mm的体积(volume)。FD作为标量(也就是说,平移运动和旋转中的绝对位移的相加)而表示时间上连续的两个体积间的头部运动。

在如上所述的具体的数据集中,在清理后去除的体积的比率超过(平均±3标准偏差)的情况下,该参加者的数据被排除于分析之外。其结果是,在数据集整体中去除了35名参加者。

因而,在学习用数据集中使用683名参加者(545名HC、138名MDD),在独立的验证数据集中使用444名参加者(263名HC、181名MDD的患者)的数据进行下面的分析。

(功能连接(FC)矩阵的计算)

在本实施方式的具体例中,对于各参加者,涉及379个关心区域(ROI)地计算功能连接FC来作为BOLD信号的时间相关性。

在功能连接的计算中,虽然没有特别限定,但是在此也使用皮尔逊相关系数。在各个可能的组的ROI的预处理后的BOLD信号的时间经过期间内计算fisher-z变换后的皮尔逊相关系数,构建元素分别表示两个ROI间的连接强度的379行×379列的对称连接矩阵。并且,为了进行分析,使用连接矩阵的下三角阵列的71,631(=(379×378)/2)的功能连接FC的值。

(地点效应的控制)

另外,下面,设为为了控制功能连接FC上的地点效应而使用如第一至第三实施方式中说明的对学习用数据集进行的多设施受检者的协调化方法来进行说明。其中,作为协调化方法,不限定于该方法,例如也可以使用如上所述的ComBat法等其它方法。

通过使用多设施受检者的协调化方法,能够去除单纯的地点间差异(测定偏倚)。此外,对于独立的验证数据集中包含的地点,不存在多设施受检者的数据集,因此为了控制独立的验证数据集中的地点效应,使用了基于ComBat法的协调化方法。

(对于训练数据集中的MDD的分类器)

作为分类器的训练数据,使用如上所述的学习用数据集来构建用于MDD的生物标记物。其基于71,631的功能连接FC的值来识别健康组(诊断为健康(HC)的诊断标签的个体组)以及MDD患者组(诊断为重性抑郁障碍的诊断标签的个体组)。

图32是用于说明用于生成这样的分类器的机器学习的过程的流程图。

如下面说明的那样,在用于生成对于MDD的分类器(下面称为“MDD分类器”)的学习处理中,使用基于L1正则化(LASSO:least absolute shrinkage and selection operator(最小绝对收缩与选择算子))的逻辑回归分析(稀疏建模法之一),从71,631个功能连接FC中选择功能连接FC的最佳的子集合。一般地,当使用L1正则化时,能够将几个参数(在下面的说明中为权重元素)设为0。也就是说,进行了特征选择,从而得到稀疏模型。其中,作为稀疏建模的手法,不限定于这样的手法,如后述那样,也能够使用其它手法,例如使用变分贝叶斯法、或者将变分贝叶斯法应用于逻辑回归得到的稀疏逻辑回归(SLR:Sparse LogisticRegression)等。

参照图32,当开始对MDD分类器的学习处理时(S100),使用预先准备(保存于存储装置2080′中)的学习数据集(S102),相关阵列计算部3002计算连接矩阵的成分。

接着,协调化计算部3020计算测定偏倚并实施协调化处理(S104)。如上所述,期望协调化处理是使用多设施受检者的方法,但也可以是其它方法。

接着,判别器生成部3008通过对所谓的“嵌套构造的交叉验证(Nested CrossValidation)”的手法进行修正而得到的方法来对学习用数据生成MDD分类器。

首先,判别器生成部3008为了使用“K折交叉验证”(K:自然数)(外侧的交叉验证)来对学习用数据执行学习处理,例如设为K=10来将学习用数据分成10份。

即,判别器生成部3008将K份(10份)之一的一部分数据集作为验证用的“测试数据集”,将其余的(K-1)份(9份)的数据设定为训练数据集(训练数据集)(S108、S110)。

接着,判别器生成部3008对训练数据集执行欠采样处理和子采样处理(S112)。

在此,“欠采样处理”是指以下处理:在训练数据集中,在与成为分类对象的特定的属性数据(两种以上)分别对应的数据的数量不一致的情况下,为了使该数量一致,去除数量较多的属性的数据来变为相同数量。在此,在训练数据集中,由于MDD患者组的受验者数与健康组的受验者数不相等,因此进行用于使它们一致的处理。

并且,“子采样处理”是指从训练数据集随机地提取规定数量的样本的处理。即,经过步骤S108~S118、S122来重复进行K次的交叉验证中,在各交叉验证中,训练数据集在MDD患者和健康者HC的数量上是不均衡的,因此设为进行用于构建分类器的欠采样方法,并且,作为子采样处理,从训练数据集随机地采样规定数量、例如130名MDD患者和相同数量的130名健康者。

此外,130名这个数值不限定于这样的值,以如下方式决定:能够根据学习数据集中的数据数量(在第一数据集中为683人)、折数K(在此,例如为K=10)、以及成为分类对象的特定属性中包含的数据数量的不均衡的程度,适当地进行如上所述的欠采样。

执行这样的子采样处理是由于,在欠采样中,在分类器无法再使用被排除的数据进行学习的方面是不利的。是为了去除该不利而重复进行M次(M:自然数、例如M=10)的随意提取过程(也就是子采样)的处理。

接着,判别器生成部3008对子采样到的子样本1~10分别执行超参数的调整处理(S114.1~S114.10)。

在此,在各子样本中,通过使用如下的逻辑函数来生成分类器子模型。这种逻辑函数是为了如下定义子样本内属于MDD类的参加者的可能性而使用的。

[数12]

其中,y

[数13]

在LASSO计算中,在成本函数中,存在权重向量的各元素的绝对值(1次)的总和(L1范数)作为第二项。在此,λ表示超参数,对应用于评价的收缩量进行控制。

在各子样本中,虽然没有特别限定,但是判别器生成部3008将规定数量的数据作为超参数调整用数据,使用其余的数据(例如,n=250人或248人的数据)来决定权重向量w。此时,虽然没有特别限定,但是判别器生成部3008例如设为超参数λ为0<λ≤1.0,使用将该区间进行P等分(P:自然数)、例如25等分得到的各值的λ,通过如上所述的LASSO计算来决定权重向量w。

此时,如上所述,作为“嵌套构造的交叉验证”,将超参数的调整作为“内侧的交叉验证”来执行。在内侧的交叉验证中,不使用外侧的交叉验证的“测试数据集”。

在此基础上,判别器生成部3008通过与所生成的各λ的值对应的逻辑函数来对超参数调整用数据比较判别性能,决定与判别性能最高的λ对应的逻辑函数(超参数的调整处理)。

接着,判别器生成部3008将“分类器子模型”设定为输出在当前的交叉验证的循环中生成的与各子样本对应的逻辑函数的输出值的平均(S116)。

判别器生成部3008将在步骤S110中准备的测试数据集作为输入来执行在当前的交叉验证的循环中生成的分类器子模型的验证(S118)。

此外,作为通过欠采样和子采样来生成子样本并在各子样本中执行特征选择来生成分类器子模型的方法,除了利用执行如上所述的LASSO法和超参数的调整的方法以外,还可以利用其它稀疏建模的手法。

判别器生成部3008当判断为K次(在此为10次)的交叉验证的循环未结束时(S122:“否”),将分为K份的数据中的与目前为止的循环中使用过的数据不同的其它部分数据集设定为测试数据集,将其余的部分数据集设定为训练数据集(S108、S110),来重复进行处理。

另一方面,判别器生成部3008在K次(10次)的交叉验证的循环结束的情况下(S122:“是”),对于输入数据而输出K×M个(在该情况下,为10×10=100个)逻辑函数(分类器)的输出的平均,生成对于MDD的分类器模型(MDD分类器)(S120)。

在MDD分类器的输出(诊断的概率值)超过0.5时,能够视为表示MDD患者的指标。

并且,在本实施方式中也是,作为通过这样生成的MDD分类器的性能的评价指标,使用马修斯相关系数(MCC:Matthews correlation coefficients)、关于ROC曲线(Receiver Operatorating Characteristic curve、接收者动作特性曲线)的ROC曲线下面积(AUC:area under the curve)、准确度(Accuracy)、灵敏度(Sensitivity)、特异性(Specificity)。

此外,使用各个子样本中选择出的特征量(在该情况下,为对测定偏倚进行协调化处理后的相关阵列的元素)来生成对象疾病(例如MDD)的分类器的手法不限于基于这种多个分类器子模型的输出的平均处理的手法,也可以设为对进行特征选择而选择出的特征量使用其它建模手法、特别是其它稀疏建模手法来生成分类器的结构。

图33是示出关于全部拍摄地点的对于学习用数据集的预测MDD的预测性能(输出的概率分布)的图。对于学习用数据集,在来自分类器模型的输出中,与MDD患者及健康者的个体组对应的两个诊断的概率分布通过阈值0.5被清楚地分离为右(MDD)和左(HC)。

分类器模型将MDD患者以66%的准确度分离于HC个体组。对应的AUC为0.77,表示高识别力。另外,MCC约为0.33。

图34是示出关于各拍摄地点的对于学习用数据集的预测MDD的预测性能(分类器的输出的概率分布)的图。从图34可知,不只是全部数据集,对于三个拍摄地点(地点1、地点2、地点4)的各个数据集,也达成了几乎相同程度的高分类精度。

此外,虽然在地点3(SWA)的数据集中只有健康者组,但是其概率分布相当于其它地点的健康者组的概率分布。

(分类器的通用化性能)

图35是示出独立的验证数据集中的MDD的分类器的输出的概率分布的图。即,使用独立的验证数据集来测试分类器模型的通用化性能。

对于MDD,在图32的处理中通过机器学习生成了100个(10折×10个子采样)的逻辑函数的分类器,将独立的验证数据集输入到所生成的全部100个分类器(作为分类器的集合的分类器模型)。然后,关于各参加者取得100个分类器的输出的平均(诊断的概率),在进行平均而得到的诊断的概率值大于0.5的情况下,作为该参加者的诊断标签,设为符合重性抑郁障碍。

在独立的验证数据集中,所生成的分类器模型以约70%的精度将MDD个体组分离于HC个体组。对应的AUC为0.75,表示能力为高识别能力(置换检验p<0.01)。

对于独立验证数据集,在来自分类器模型的输出中,与MDD患者及健康者的个体组对应的两个诊断的概率分布通过阈值0.5被清楚地分离为右(MDD)和左(HC)。灵敏度为68%,特异性为71%。这使得成为0.38这样的较高的MCC值(置换检验p<0.01)。

图36是示出关于各拍摄地点的、MDD的分类器对于独立验证数据集的输出的概率分布的图。可以获知:不只是四个拍摄地点的全部数据集,对于各个数据集也能够达成高的分类精度。

此外,在以上的说明中,说明了通过如图32所示的流程图生成的K×M个逻辑函数(分类器)的输出的平均为分类器模型(MDD分类器)的例子。通过这种结构,基于在多个测量地点处由不同的测量装置测量出的脑活动信息(时间序列的静息态fMRI图像信息),能够生成具有充分的通用化性能从而能够对健康组和患者组进行分类的分类器。

但是,在协调化处理后,构成MDD分类器的过程并不限定于此,例如也可以通过下面的公知文献16或17中公开的“稀疏建模”的手法来生成与“诊断标签”对应的MDD分类器。将公知文献16和17的公开全部通过参照引用于此处。

公知文献16:日本专利第6341513号

公知文献17:日本专利第6195329号

例如,在日本专利第6195329号中,根据对于健康组、患者组测定出的静息态功能连接的MRI的数据,导出规定的脑区域间的活动度的相关阵列。对于包含受验者的诊断标签的受验者的属性和相关阵列,通过正则化典型相关分析(SCCA:Sparse CanonicalCorrelation Analysis(稀疏典型相关分析))来提取相关阵列的同仅与诊断标签对应的正准变量连接的元素。对于通过正则化典型相关分析的特征提取而得到的相关阵列的元素的第一和集,通过基于留一交叉验证的稀疏逻辑回归(SLR)来提取相关阵列的元素的第二和集。对于第二和集,通过基于稀疏逻辑回归的判别分析来生成判别器。

稀疏逻辑回归是将逻辑回归分析扩展为贝叶斯估计框架的手法,是与用于判别特征向量的维数压缩的权重估计同时进行的手法。对于数据的特征向量的维数非常高且包含有很多不需要的特征量的情况是有用的。对于不需要的特征量,使线性判别分析中的权重参数为零(即,进行特征选择),仅提取与判别相关联的极少量的特征量(稀疏性)。

对于通过稀疏逻辑回归获得的特征数据,按每个类求出属于分类出的类的概率p,并分配到输出了最大值的类。通过逻辑回归式输出p。通过ARD(Automatic Relevancedetermination:自动相关确定)来进行权重的估计,对于类判别的贡献少的特征量通过使权重接近0来排除于计算之外。

此外,关于这样的稀疏逻辑回归,在下面的公知文献18或19中有公开。将公知文献18和19的公开全部通过参照引用于此处。

公知文献18:Okito Yamashita,Masaaki Sato,Taku Yoshioka,Frank Tong,andYukiyasu Kamitani.“Sparse Estimation automatically selects voxels relevantfor the decoding of fMRI activity patterns(稀疏估计自动选择与fMRI活动模式解码相关的体素).”NeuroImage,Vol.42,No.4,pp.1414-1429,2008.

公知文献19:相良和彦、田中靖人、竹市博臣、山下宙人、长谷川良平、冈部达哉、前田太郎著、“ブレインコミュニケーション-脳と社会の通信手段-(大脑沟通-大脑与社会的沟通手段-)”、电子信息通信学会编、CORONA公司、平成23年4月25日初版第1版发行(診断と症候に共通する脳機能結合の抽出(诊断与症状所共通的脑功能连接的提取))

以往也如下面的公知文献20所示的那样在基于静息态脑功能连接构建用于识别健康组(HC)和MDD患者组的生物标记物的情况下,以(医生通过以往的基于症状的手法进行的)MDD的诊断为基础。将公知文献20的公开全部通过参照引用于此处。

公知文献20:Ichikawa,N.,Lisi,G.,Yahata,N.,Okada,G.,Takamura,M.,Yamada,M.,et al.(2017).Identifying melancholic depression biomarker using whole-brain functional connectivity(利用全脑功能连接识别忧郁症生物标志物).arXiv.

然而,在很多的研究中,指出了找出已有的临床诊断的范畴与神经生物学的异常之间的明确的关联性的难度。认为这种困难是由于对各患者的诊断是基于症状、流行病学调查以及医生的经验等复杂混合得到的信息这样的事实所致的。关于多种疾病的构造、功能以及遗传异常的高度复杂的病理状态使得该问题进一步变难。

在这样的背景下,为了进行基于脑科学理解的MDD的诊断和治疗,需要将与MDD诊断有关的功能连接以及与抑郁症的症状有关的静息态功能连接进行比较,并调查与这种症状相关联的功能连接。

因此,下面,说明自动地客观地识别与诊断及症状有关的静息态功能连接FC那样的机器学习算法。

图37是像这样导出精神疾病(例如重性抑郁障碍)的诊断和症状中共通的脑内的功能连接的过程的概念图。即,如目前为止所说明的那样,基于静息态的脑功能连接来生成识别健康组(HC)和患者组(例如MDD患者组)那样的分类器。另一方面,如下面说明的那样,基于静息态的脑功能连接来构建症状的评价标准(例如贝克抑郁自评量表II)的回归模型。之后,提取与诊断有关的脑功能连接以及与症状有关的脑功能连接之间的共通部分。

图38是用于说明生成如预测这种症状的评价标准(例如贝克抑郁自评量表II)那样的回归模型的过程的流程图。

参照图38,当开始对于评价标准的回归模型的学习处理时(S200),相关阵列计算部3002使用预先准备(保存于存储装置2080′中)的学习数据集(S202),计算连接矩阵的成分。

接着,协调化计算部3020计算测定偏倚并实施协调化处理(S204)。如上所述,期望协调化处理是使用多设施受检者的方法,但也可以是其它方法。

接着,判别器生成部3008获取协调化处理后的数据集中的、关于已获取症状评价标准(例如BDI得分)的参加者的数据来作为学习用数据集(S206)。

接着,判别器生成部3008通过所谓的“K折交叉验证”的手法来对学习用数据生成评价标准的回归模型。

首先,判别器生成部3008为了使用“K折交叉验证”来对学习用数据执行学习处理,例如设为K=10来将学习用数据分成10份。即,判别器生成部3008将K份(例如10份)之一的一部分数据集作为验证用的“测试数据集”,将其余的(K-1)份(9份)的数据设定为训练数据集(训练数据集)(S210、S212)。

接着,判别器生成部3008如下面的式子那样使用基于71,631的功能连接FC的值得到的学习用数据集来构建直线回归模型以预测BDI得分。即,为了构建直线回归模型,对于具有BDI得分的学习用数据集使用LASSO法,判别器生成部3008如下面那样使用直线回归来生成回归子模型i(i=1~K)(S214)。

(预测BDI

在此,预测BDI

接着,通过测试数据集来执行回归子模型i的验证(S216)。

接着,判别器生成部3008当判断为K次(10次)的交叉验证的循环未结束时(S218:“否”),将分为K份的数据中的与目前为止的循环中使用过的数据不同的其它部分数据集设定为测试数据集,将其余的部分数据集设定为训练数据集(S210、S212),来重复进行处理。

另一方面,在K次(10次)的交叉验证的循环结束的情况下(S218:“是”),判别器生成部3008在训练数据集中的分成10份的数据集中提取将为了生成子模型而选择的功能连接FC进行了整合的大脑的功能连接的子集合(S220),将这样的大脑的功能连接的子集合作为说明变量来构建回归模型(S222)。

但是,在这样的过程中,引起各份间的信息泄漏,从而对于训练数据集的学习结果可能引起过度适应。因此,如下面说明的那样,通过对独立的验证数据集应用该回归模型,还对通用化性能进行确认。

图3是示出基于学习用数据集生成的回归模型的预测性能的图。如图39所示,还一并示出通过回归模型预测出的BDI得分与实际测量出的BDI得分之间的平均绝对误差(MAE)以及皮尔逊相关系数r。

参照图39可知,通过该回归模型,利用统计上有意义的相关性很好地预测出BDI得分(r=0.62以及p=5.3×10

图40是示出独立的验证数据集时的BDI得分的回归模型的性能的图。图40是测定出的BDI和预测出的BDI的散布图。

在此,也可知,通过该回归模型,利用统计上有意义的相关性很好地预测出BDI得分((r=0.21、p=9.1×10

图41是示出MDD分类器和BDI回归模型双方的构建中共通的7个脑功能连接FC的空间分布的图。在图41中,诊断与症状之间的共通的功能连接被表示为从后面、左、右以及上部观察得到的图。半球间连接仅在后部和俯视图中被示出。

图42是示出表示图41所示的共通的7个脑功能连接FC的特性的列表的图。在图42中,示出共通的功能连接以及BDI得分的回归模型中的权重(weight)。

在提取图41和图42所示的共通的功能连接FC时,首先,通过判别器生成部3008来提取来自MDD分类器的与诊断有关的重要的功能连接FC以及来自BDI回归模型的与症状有关的重要的功能连接FC。

具体地说,判别器生成部3008计算各功能连接FC在十折交叉验证中通过LASSO计算而被选择出的次数。在通过二项式检验判定为这样的计数明显高于偶然的情况下,将功能连接FC判定为重要。

在如以上说明的具体例中,在每一个交叉验证中,MDD分类器中使用的功能连接FC的数量平均为329.1(该FC的数量为在10个子采样中被选择至少一次以上的数量),因此关于与诊断有关的FC,假定次数的二项式分布为B(10,329/71,631)。之后,在Bonferroni校正后,将显著性水平设定为0.05/71,631。

在以上的具体例的情况下,判别器生成部3008判断为在十折交叉验证中被选择三次以上的FC是与诊断有关的重要的FC。

同样地,关于与症状有关的FC,在BDI回归模型中使用的功能连接FC的数量在每一折的交叉验证中平均为3.4,因此假定次数的二项式分布为B(10,3/71,631)。在以上的具体例的情况下,判别器生成部3008判断为在十折交叉验证中被选择一次以上的FC是与症状有关的重要的FC。

通过机器学习算法根据MDD患者组与健康组HC之间的分类器以及BDI得分的回归模型的数据来自动且客观地确定与诊断有关的340个功能连接FC以及与症状有关的21个功能连接FC。

在340个功能连接FC与21个功能连接FC之间有7个功能连接FC是共通的。

图43是示出共通的功能连接FC中的学习用数据集和独立的验证数据集之间的功能连接FC的值的图。如图43所示,7个共通的功能连接FC的平均的功能连接的值在学习用数据集与独立的验证数据集之间是非常相似的。其结果表明:7个功能连接FC在表征MDD和抑郁症的症状的神经基础上是可靠的。

因而,根据如以上说明的方法表明:使用在多个地点处收集的MDD患者组和健康组HC的静息态fMRI数据,并利用功能连接FC的全脑的图案,能够构建基于脑图像检查的可靠的对于MDD的分类器和BDI的回归模型。

MDD分类器对于独立的验证数据集实现了高通用化的预测性能AUC和MCC。并且,高通用化的预测性能不仅能够对于独立的验证数据集的全部数据集实现,还能够对于四个拍摄地点的数据集单独地实现。这些验证数据集不包含在学习用数据集中。而且,独立的验证数据集中的拍摄协议严格来说是与学习用数据集中的拍摄协议不同的,但是实现了通用化。不仅基于大脑的功能连接FC成功构建了通用化到独立的验证数据的MDD分类器,还成功实现了不受MDD亚型限制的对MDD的通用化的分类。

另外,如以上说明的机器学习算法具有可靠性,能够提取疾病(例如MDD)的分类器和症状的评价标准(例如BDI得分)的回归模型双方共通且重要的功能连接FC。

并且,如下面那样,关于MDD,还示出作为诊断与症状共通的7个功能连接FC的特性而具有如下几点。

第一,关于功能连接FC的强度,在MDD个体组中,7个FC都呈现出超低连接性(hypoconnectivity)(即,MDD个体组中的功能连接FC的强度相比于HC个体组的功能连接FC的强度更接近0)。

第二,7个功能连接FC在对固有的功能性网络的贡献上与默认模式网络及突显网络具有密切的关系。

在包含这7个功能连接FC的13个脑区域中,5个部位属于默认模式网络,5个部位属于突显网络。

并且,6个功能连接FC在默认模式网络和突显网络的任一个中具有节点(ROI)。7个功能连接FC中的2个功能连接FC为两个网络间的连接。2个功能连接FC为默认模式网络内的连接,1个功能连接FC为突显网络内的连接。在以往有默认模式网络和突显网络参与抑郁症的报告,如上所述的结果与这些报告不产生矛盾。

生物标记物是为了对患者进行诊断而开发出的,但是焦点正在逐步转变为对用于决定治疗的目标的生物标记物进行确定(也就是说,将诊断与治疗结合的生物标记物)。这使得更多的个体化治疗方法成为可能。在如上所述的过程中提取出的共通的功能连接FC不仅与MDD的诊断有关,还与抑郁症的症状有关,因此这7个功能连接FC有望成为将对于MDD的诊断与治疗结合的生物标记物的候选。因而,为了实现抑郁症状的改善,例如能够通过如下面的公知文献21中公开的手法来对这些功能连接FC使用如功能连接神经反馈训练那样的对功能连接进行干预的方法。将公知文献21的公开全部通过参照引用于此处。

公知文献21:Yamada,T.,Hashimoto,R.I.,Yahata,N.,Ichikawa,N.,Yoshihara,Y.,Okamoto,Y.,et al.(2017).Resting-State Functional Connectivity-BasedBiomarkers and Functional MRI-Based Neurofeedback for Psychiatric Disorders:AChallenge for Developing Theranostic Biomarkers(基于静息状态功能连接性的生物标记物和基于功能性MRI的神经反馈治疗精神障碍:发展治疗生物标记物的挑战).Int JNeuropsychopharmacol 20(10),769-781.doi:10.1093/ijnp/pyx059.

本次公开的实施方式是用于具体地实施本发明的结构的例示,不是对本发明的保护范围进行限制。本发明的保护范围不是实施方式所说明的范围,而是通过权利要求书来表示的范围,意图包含权利要求书的内容上的范围以及均等意义的范围内的变更。

附图标记说明

2:受验者;6:显示器;10:MRI装置;11:磁场施加机构;12:静磁场产生线圈;14:倾斜磁场产生线圈;16:RF照射部;18:卧具;20:接收线圈;21:驱动部;22:静磁场电源;24:倾斜磁场电源;26:信号发送部;28:信号接收部;30:卧具驱动部;32:数据处理部;36:存储部;38:显示部;40:输入部;42:控制部;44:接口部;46:数据收集部;48:图像处理部;50:网络接口。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号