公开/公告号CN113164163A
专利类型发明专利
公开/公告日2021-07-23
原文格式PDF
申请/专利权人 学校法人庆应义塾;
申请/专利号CN201980082589.5
申请日2019-12-13
分类号A61B10/00(20060101);A61B5/01(20060101);A61B5/02(20060101);A61B5/16(20060101);A61B5/22(20060101);G16H50/20(20060101);
代理机构31300 上海华诚知识产权代理有限公司;
代理人刘煜
地址 日本国东京都港区三田2丁目15番45号
入库时间 2023-06-19 11:57:35
技术领域
本发明涉及推断抑郁状态(depressive state)的装置、方法及其程序,更详细而言,涉及根据生物体数据来推断抑郁症或躁郁症的抑郁状态的装置、方法及其程序。
背景技术
近年来,发达国家的精神疾病患者一直在增加,作为情感障碍的一种类型的抑郁症或躁郁症的患者数量特别多。情感障碍大致分为只有抑郁发作(depressive episode)的“抑郁性障碍”和伴有称为“躁狂发作”症状的“双相障碍”。
当因抑郁症或躁郁症而进入抑郁状态时,通常会出现精力减退、失去活力的情况,专利文献1中揭示了一种根据受试者的活动量和脉搏间隔,在满足规定条件式的情况下判定为双相障碍的技术。
现有技术文献
专利文献
专利文献1:日本专利特开2018-33795号公报
发明内容
发明要解决的问题
发明者等人发现,通过有效利用估计今后会普及的可穿戴设备,可以改善抑郁状态的判定技术。本发明的目的在于提供一种使用可穿戴设备来推断抑郁状态用的新的装置、方法及其程序。
解决问题的技术手段
为了达成这样的目的,本发明的第1形态为一种方法,其根据生物体数据来推断受试者的抑郁状态的方法,该方法的特征在于,包含如下步骤:将包括多种数据类型的生物体数据按每一数据类型转换为规定时间单位的单位时间数据;根据所述单位时间数据来提取1个或多个特征量;以及以所述1个或多个特征量中的至少一部分为输入,使用预先定下的推断模型来推断抑郁状态。
此外,本发明的第2形态为根据第1形态所述的方法,其特征在于,所述生物体数据为借助所述受试者戴在身上的可穿戴设备测量出的数据或者与其相对应的数据。
此外,本发明的第3形态为根据第1形态或第2形态所述的方法,其特征在于,所述生物体数据为跨及48小时以上的期间测量出的数据或者与其相对应的数据。
此外,本发明的第4形态为根据第1形态至第3形态中任一项所述的方法,其特征在于,所述规定时间为1小时。
此外,本发明的第5形态为根据第1形态至第4形态中任一项所述的方法,其特征在于,所述多种数据类型包括皮肤温度。
此外,本发明的第6形态为根据第5形态所述的方法,其特征在于,所述多种数据类型还包括步数、消耗能量、体动、心率、睡眠状态以及紫外线水平中的至少任一种。
此外,本发明的第7形态为根据第1形态至第6形态中任一项所述的方法,其特征在于,所述1个或多个特征量包括各数据类型的所述单位时间数据的分位数、各数据类型的所述单位时间数据的标准偏差、以及多种数据类型的各组合的相关系数中的至少任一种。
此外,本发明的第8形态为根据第1形态至第7形态中任一项所述的方法,其特征在于,所述1个或多个特征量中的所述至少一部分是通过正则化来加以选择。
此外,本发明的第9形态为根据第1形态至第8形态中任一项所述的方法,其特征在于,所述推断模型是通过机器学习生成的推断抑郁状态的有无的模型。
此外,本发明的第10形态为根据第1形态至第8形态中任一项所述的方法,其特征在于,所述推断模型是通过机器学习生成的推断抑郁状态的重症度的模型。
此外,本发明的第11形态为根据第10形态所述的方法,其特征在于,所述重症度为HAMD的分数。
此外,本发明的第12形态为根据第10形态或第11形态所述的方法,其特征在于,所述生物体数据是跨及72小时以上的期间测量出的数据或者与其相对应的数据。
此外,本发明的第13形态为一种程序,其用于使计算机执行根据生物体数据来推断受试者的抑郁状态的方法,该程序的特征在于,所述方法包含如下步骤:将包括多种数据类型的生物体数据按每一数据类型转换为规定时间单位的单位时间数据;从所述单位时间数据中提取1个或多个特征量;以及,以所述1个或多个特征量中的至少一部分为输入,使用预先定下的推断模型来推断抑郁状态。
此外,本发明的第14形态为一种装置,其根据生物体数据来推断受试者的抑郁状态,该装置的特征在于,将包括多种数据类型的生物体数据按每一数据类型转换为规定时间单位的单位时间数据,从所述单位时间数据中提取1个或多个特征量,以所述1个或多个特征量中的至少一部分为输入,使用预先定下的推断模型来推断抑郁状态。
此外,本发明的第15形态为一种生成方法,它是用于根据多个受试者的生物体数据来推断抑郁状态的推断模型的生成方法,该方法的特征在于,包含如下步骤:按每一受试者将包括多种数据类型的生物体数据按每一数据类型转换为规定时间单位的单位时间数据;按每一受试者从所述单位时间数据中提取1个或多个特征量;以及,通过使用教学数据的机器学习来生成所述推断模型,所述教学数据将各受试者的所述1个或多个特征量中的至少一部分作为输入向量,将专家给出的对各受试者的诊断结果作为标签。
此外,本发明的第16形态为根据第15形态所述的生成方法,其特征在于,所述机器学习为集成学习。
此外,本发明的第17形态为根据第15形态或第16形态所述的生成方法,其特征在于,所述1个或多个特征量包括各数据类型的所述单位时间数据的分位数、各数据类型的所述单位时间数据的标准偏差、以及多种数据类型的各组合的相关系数中的至少任一种。
此外,本发明的第18形态为根据第15形态至第17形态中任一项所述的生成方法,其特征在于,所述1个或多个特征量中的所述至少一部分是通过正则化来加以选择。
此外,本发明的第19形态为一种程序,其用于使计算机执行根据多个受试者的生物体数据来推断抑郁状态用的推断模型的生成方法,该方法的特征在于,所述生成方法包含如下步骤:按每一受试者将包括多种数据类型的生物体数据按每一数据类型转换为规定时间单位的单位时间数据;按每一受试者从所述单位时间数据中提取1个或多个特征量;以及,通过使用教学数据的机器学习来生成所述推断模型,所述教学数据将各受试者的所述1个或多个特征量中的至少一部分作为输入,将专家给出的对各受试者的诊断结果作为标签。
此外,本发明的第20形态为一种装置,其生成根据多个受试者的生物体数据来推断抑郁状态用的推断模型,该装置的特征在于,按每一受试者将包括多种数据类型的生物体数据按每一数据类型转换为规定时间单位的单位时间数据,按每一受试者从所述单位时间数据中提取1个或多个特征量,通过使用教学数据的机器学习来生成所述推断模型,所述教学数据将各受试者的所述1个或多个特征量中的至少一部分作为输入,将专家给出的对各受试者的诊断结果作为标签。
发明的效果
根据本发明的一形态,使用可穿戴设备来获取包括多种数据类型的生物体数据,借助基于该生物体数据的1个或多个特征量来推断抑郁状态,由此,可以改善以往的推断技术。
附图说明
图1为表示本发明的第1实施方式的装置的图。
图2为用于说明本发明的第1实施方式的推断模型的生成过程的图。
图3为用于说明使用本发明的第1实施方式的推断模型的推断过程的图。
图4为表示本发明的实施例2-1的推断结果的精度的图。
图5为表示本发明的实施例2-2的推断结果的精度的图。
图6为表示本发明的实施例2-3的推断结果的精度的图。
具体实施方式
下面,参考附图,对本发明的实施方式进行详细说明。
(第1实施方式)
在本发明的第1实施方式中,使用腕带型的配备有加速度传感器、脉搏传感器、紫外线传感器以及温度传感器的Silmee(注册商标)W20这一产品作为可穿戴设备。从加速度传感器获得步数、消耗能量、体动以及睡眠状态相关的生物体数据,从紫外线传感器获得紫外线水平,从温度传感器获得皮肤温度相关的生物体数据。
关于从加速度传感器获得的睡眠状态(sleep state)相关的生物体数据,更具体而言,与作为体动记录仪(actigraphy)为人所知的方法一样,能够通过以下方式获取:若根据三轴加速度传感器的各轴的方向上的加速度算出的值超过了规定阈值,则判定为清醒状态,若未超过规定阈值,则判定为睡着状态。作为一例,若记录加速度传感器的值的各时刻或各时间点的睡眠状态为睡着状态(sleeping state),则以1来表现,若为清醒状态(awakestate),则以0来表现,可以将值为1的状态所连续的时间评价为睡眠时间,将其开始时刻及结束时刻分别评价为就寝时刻及起床时刻。此外,作为一例,可列举在睡眠状态的评价中还反映加速度传感器的值以外的心率等的值。
关于从温度传感器获得的皮肤温度(skin temperature)相关的生物体数据,更具体而言,可以通过测定佩戴可穿戴设备110的手腕等部位的皮肤温度来获得。准确的体温称为核心体温(core temperature),是通过直肠温度、腋窝温度等的测定来获得,而本实施方式中测定的皮肤温度在受试者上的测定负担较小,能现实地实现持续性的数据获取。
图1展示本实施方式的装置。装置100通过有线或无线与可穿戴设备110连接,接收借助可穿戴设备110获得的生物体数据。装置100也可不像图示那样直接接收生物体数据,而是可穿戴设备110与智能手机等移动终端连接,经由该移动终端来接收数据,或者,可穿戴设备110与互联网等IP网络上的服务器连接,经由该服务器来接收数据,或者,将得到的生物体数据通过USB支座输入到装置100中。
装置100具备处理器、CPU等处理部101、包含存储器、硬盘等存储装置或存储介质的存储部102、以及通过有线或无线与其他设备通信用的通信接口等通信部103,可以通过在处理部101中执行进行各处理用的程序来构成。装置100有时包含1个或多个装置、计算机或服务器,此外,该程序有时包含1个或多个程序,此外,可以记录在计算机可读取的存储介质中而设为非临时性的程序产品。
在本实施方式中,首先,使用借助可穿戴设备110从多个受试者获得的生物体数据、通过机器学习来生成用于推断抑郁状态的有无的推断模型。继而,使用该推断模型来进行新的受试者的抑郁状态的推断。以下分为推断模型的生成和使用推断模型的推断来进行说明。虽然都作为装置100中的处理来进行说明,但设想的是推断模型的生成与使用推断模型的推断能在不同计算机中进行。本实施方式的方法对于甄别抑郁状态是有用的,尤其可以在职业健康中的健康诊断等当中加以有效利用。
将来自l位(l为正整数)受试者的m天(m为正数)的生物体数据按每一数据类型转换为1小时等预先定下的时间单位的数据(以下称为“单位时间数据(unit time data)”)(S201)。作为生物体数据中包括的数据类型,可列举步数、消耗能量、体动、心率、睡眠状态、皮肤温度以及紫外线水平。数据类型有时也称为数据形态(modality)。作为一例,步数、消耗能量、体动以及睡眠状态即睡眠时间可以将跨及预先定下的时间累计得到的值作为单位时间数据,心率、皮肤温度以及紫外线水平可以将预先定下的时间内的平均值作为单位时间数据。此外,心率、皮肤温度以及紫外线水平也可采用跨及预先定下的时间累计得到的值。
接着,按每一受试者而且是每一数据类型来决定得到的24m的样本数据的分布的n个(n为正整数)分位数(S202)。例如设定n=5,存储第5百分位数、第25百分位数、第50百分位数、第75百分位数、第95百分位数这5个分位数。此处是以单位时间数据为1小时单位这一情况为例。
此外,按每一受试者而且是每一数据类型来算出得到的24m的样本数据的分布的标准偏差(S203)。
继而,按每一受试者针对数据类型的各组合来算出皮尔逊相关系数等相关系数(S204)。若数据类型为上述7种,则有21种组合。此处是以分位数、标准偏差、皮尔逊相关系数这一顺序来进行的说明,但它们的顺序可以不同。
然后,将以如此方式从各受试者的生物体数据中提取出的分位数、标准偏差以及相关系数等特征量(feature)作为输入或输入向量,将医生等专家给出的针对各受试者的抑郁状态的有无(presence or absence)的评价作为标签,通过使用l-1人的结果作为教学数据的机器学习来训练是否为抑郁状态的分类问题的推断模型(S206)。生成的推断模型存储至进行使用该推断模型的推断的装置100的存储部102或者能从装置100访问的存储介质或存储装置。
也可为例如通过正则化的一种方法即L1正则化、L2正则化、它们组合而成的Elastic Net等来选择提取出的特征量的一部分即子集(S205),将其作为输入向量。此外,机器学习可以通过梯度提升的一种方法即XGBoost等集成学习来进行。
使用从教学数据中去掉的1人的结果来进行生成的推断模型的交叉验证(crossvalidation)。顺带一提,推断模型的有效性的验证并非一定限于这种leave-one-out交叉验证(LOOCV)。作为具体例,可列举k折交叉验证(k-fold cross validation),这是一种对教学数据作k分割、将使用分割出的任1组数据的验证重复k次的方法。验证的方法会对用于学习的数据产生影响,因此也会影响生成的推断模型的精度,而与LOOCV相比,k折交叉验证通常会缓和过拟合的问题。
将进行抑郁状态的有无判定的受试者的m'天(m'为正数)的生物体数据按每一数据类型转换为单位时间数据(S301)。向单位时间数据的转换可以使用如下各种方法:将可穿戴设备110测定出的生物体数据或者对其在可穿戴设备110或装置100中实施处理得到的与该生物体数据相对应的数据转换为1分钟单位的数据,之后进一步转换为1小时单位的数据等。这一点在预测模型的生成时也是一样的。其中,推断时的单位时间与生成时的单位时间较理想为相等。
继而,按每一数据类型来提取并存储特征量(S302)。视需要选择特征量的子集,以特征量或其子集为输入或输入向量,使用预先生成的推断模型来推断抑郁状态的有无(S303)。
在上述说明中,列举的是特定产品作为可穿戴设备的例子,但只要是具备加速度传感器、脉搏传感器、紫外线传感器以及温度传感器的产品即可,此外,优选采用至少具备认为对预测模型的高精度有大的贡献的温度传感器的可穿戴设备。
再者,请注意,只要没有像“仅基于××”、“仅根据××”、“仅××的情况”这样的“仅”的记载,本说明书中也可能会考虑附加性的信息。此外请注意,作为一例,“在a的情况下作b动作”这一记载除了明示的情况以外,并非一定表示“在a的情况下始终作b动作”。
此外,为了明确起见而顺带一提的是,在某种方法、程序、终端、装置、服务器或系统(以下记作“方法等”)中,即便有进行与本说明书记述的动作不一样的动作的方面,本发明的各形态也是以与本说明书中记述的动作中的任一动作相同的动作为对象,存在与本说明书中记述的动作不一样的动作并不会使该方法等处于本发明的各形态的范围外。
使用Silmee W20针对62位受试者获取2天以上的生物体数据,以本实施方式的方法生成推断模型。通过leave-one-out交叉验证来进行推断模型的验证。继而,对使用该推断模型的抑郁状态的有无的推断结果与医生给出的诊断结果进行比较,所得结果见下表。生物体数据使用的是诊断日前的6天中的2天以上的生物体数据,进行基于Elastic Net的子集的选择以及基于XGBoost的机器学习。单位时间数据为1小时单位的值。
[表1]
医生对抑郁症的诊断使用的是抑郁症的通常的诊断指标即汉密顿量表HAMD,本实施例中将HAMD17的截断值设为7,在分数超过7的情况下判断为抑郁症。准确率(accuracy)为0.854,召回率(recall)为0.906,特异度(specificity)为0.800。
根据本实施例得知,以高精度进行了抑郁状态的推断,能够甄别健康人士与抑郁症患者。认为,将据发明者等人所知以往没有指出过对抑郁状态的推断有益的皮肤温度组合到此前已指出的心率等当中将有助于高精度的实现。因而,作为生物体数据,优选包含2种以上的数据类型,所述2种以上的数据类型包含皮肤温度、和步数、能量、体动、心率、睡眠状态以及紫外线水平中的至少任一种。
在与实施例1-1同样的条件下针对55位受试者获取诊断日前的6天中的3天以上的生物体数据,以本实施方式的方法进行推断模型的生成以及抑郁状态的推断,所得结果见下表。
[表2]
准确率为0.855,召回率为0.862,特异度为0.846。
根据本实施例得知,以高精度进行了抑郁状态的推断,但与以2天的生物体数据进行的抑郁状态的有无的推断相比见不到明显的精度提高,可以说,本实施方式的方法只要使用2天或48小时的生物体数据便能获得足够高的精度。这使得受试者不得不佩戴可穿戴设备110的期间缩短,而佩戴时间短、受试者的负担小将促进早期发现抑郁症这一目的的甄别的普及。
针对86位受试者使用Silmee W20获取3天以上的生物体数据,以本实施方式的方法生成推断模型。通过10-fold交叉验证来进行推断模型的验证。继而,对使用该推断模型的抑郁状态的有无的推断结果与医生给出的诊断结果进行比较,所得结果见下表。关于生物体数据,对针对86人得到的228个样本数据作了10分割。此处,同一受试者的数据放到同一组(fold)。此外,从一部分受试者获取了多个数据集。不进行子集的选择,进行基于XGBoost的机器学习。单位时间数据为1小时单位的值。
[表3]
准确率为0.737,召回率为0.661,特异度为0.807。虽然认为将验证方法从LOOCV改为10-fold交叉验证带来的过拟合的缓和导致了准确率等的若干降低,但依然进行的是高精度下的推断。
在生成的推断模型中,对表示哪一特征量对推断结果有大的贡献的各特征量的重要度(importance)进行了计算,所得结果见下表,具体而言,通过计算改变某一特征量时模型精度有多少改善来推断出每一特征量的重要度,使用的是微软提供的服务“AzureMachine Learning(商标)”。若针对所有特征量加以合计,则重要度为1。
[表4]
得知,睡眠状态与皮肤温度的相关系数、皮肤温度的第50百分位数还有体动的标准偏差是重要度较高的特征量,确认了皮肤温度的贡献较大。此外,皮肤温度与睡眠状态的相关系数的贡献也较大,可以说优选除了皮肤温度以外还包含睡眠状态作为生物体数据。
(第2实施方式)
本发明的第2实施方式不仅可以推断抑郁状态的有无还能推断抑郁状态的重症度(severity),或者可以推断抑郁状态的重症度(severity)代替抑郁状态的有无。首先,使用借助可穿戴设备110从多个受试者获得的生物体数据,通过机器学习来生成用于推断抑郁状态的重症度的推断模型。继而,使用该推断模型来推断新的受试者的抑郁状态的重症度。
本实施方式中的推断模型的生成与第1实施方式中参考图2说明过的相同,不同点在于,机器学习时使用的医生的诊断结果是抑郁状态的重症度的分数而不是抑郁状态的有无,另外,机器学习中使用的算法是适于回归问题的算法而不是适于分类问题的算法。
此外,本实施方式中的使用推断模型的推断与第1实施方式中参考图3说明过的相同,不同点在于,输出为抑郁状态的重症度而不是抑郁状态的有无。
抑郁状态的重症度可以使用汉密顿量表HAMD。HAMD有若干版本,在HAMD17中,医生等专家对17个项目进行评价,各项目有3~5分,例如以7分以下为正常、8~13分为轻症、14~18分为中等症、19~22分为重症、23分以上为最重症的方式进行诊断。
根据本实施方式的方法,可以判定抑郁状态的重症度,因此能有助于抑郁状态的治疗方针的判断、处方药的变更等治疗上所需的缜密判断,在精神科临床上的诊断治疗辅助上有益性较高。
针对62位受试者使用Silmee W20获取2天以上的生物体数据,以本实施方式的方法生成推断模型。通过leave-one-out交叉验证来进行推断模型的验证。继而,对使用该推断模型的抑郁状态的有无的推断结果与医生给出的诊断结果进行比较,所得结果见图4。生物体数据使用的是诊断日前的6天中的2天以上的生物体数据,进行基于Elastic Net的子集的选择以及基于XGBoost的机器学习。单位时间数据为1小时单位的值。
得到平均绝对误差(mean absolute error)为4.11、相关系数(correlationcoefficient)为0.604、p值为2.04×10
在与实施例2-1同样的条件下针对55位受试者获取3天以上的生物体数据,以本实施方式的方法进行推断模型的生成以及抑郁状态的重症度的推断,所得结果见图5。
得到平均绝对误差为3.29、相关系数为0.763、p值为1.22×10
针对86位受试者使用Silmee W20获取7天以上的生物体数据,以本实施方式的方法生成推断模型。通过10-fold交叉验证来进行推断模型的验证。继而,对使用该推断模型的抑郁状态的有无的推断结果与医生给出的诊断结果进行比较,所得结果见图6。关于生物体数据,对针对86人得到的236个样本数据作了10分割。此处,同一受试者的数据放到同一组(fold)。此外,从一部分受试者获取了多个数据集。不进行子集的选择,进行基于XGBoost的机器学习。单位时间数据为1小时单位的值。
得到平均绝对误差为4.94、相关系数为0.610、p值为2.20×10
在生成的推断模型中,对表示哪一特征量对推断结果有大的贡献的各特征量的重要度(importance)进行了计算,所得结果见下表,具体使用的是微软提供的服务“AzureMachine Learning(商标)”。若针对所有特征量加以合计,则重要度为1。
[表5]
得知,皮肤温度的第95百分位数、睡眠状态与皮肤温度的相关系数还有皮肤温度的第50百分位数是重要度较高的特征量,与实施例1-3一样,确认了皮肤温度的贡献较大。此外,与实施例1-3一样,皮肤温度与睡眠状态的相关系数的贡献也较大,可以说优选除了皮肤温度以外还包含睡眠状态作为生物体数据。
符号说明
100…装置
101…处理部
102…存储部
103…通信部
110…可穿戴设备。
机译: 起始因素推断装置,起始因素推断方法,起始因素推断装置程序和起始因素推断系统
机译: 推断个体中tgf-b细胞信号传导途径活性的计算机实施方法;用于推断个体中tgf-b细胞信号传导途径活性的装置;非瞬态存储介质;电脑程序;用于测量个体样品中三个或更多tgf-b细胞信号通路靶基因表达水平的试剂盒;推断个体中tgf-b细胞信号通路的活性;推断个体中tgf-b细胞信号通路的活性;套件的使用
机译: 设备推断装置,设备推断方法以及设备推断程序