公开/公告号CN112270441A
专利类型发明专利
公开/公告日2021-01-26
原文格式PDF
申请/专利号CN202011188949.0
申请日2020-10-30
分类号G06Q10/04(20120101);G06K9/62(20060101);G06N20/00(20190101);G16H50/30(20180101);
代理机构31319 上海德禾翰通律师事务所;
代理人夏思秋
地址 200241 上海市闵行区东川路500号
入库时间 2023-06-19 09:41:38
技术领域
本发明属于人工智能技术领域,具体涉及一种建立自闭症儿童康复预测模型的方法以及基于该模型方法的系统。
背景技术
症状分析是自闭症儿童康复活动中的重要一环。目前,自闭症儿童的康复环节中,症状分析都是由康复师根据特征表现,以以往具有相似表现的症状分析为基础,生成新的症状分析反馈给自闭症儿童。
自闭症儿童的基数极为庞大,而有经验的康复师的数量相较之下则少之又少,如何将经验丰富的康复师对儿童通过经验进行的康复趋势的判断转化为科学可复现的预测模型,是一个重要的问题。经验不足的康复师们可能无法对自闭症儿童做出最有效的康复趋势判断,通过机器学习将康复师的经验转化为预测模型,可以大大提高经验尚浅的康复师对自闭症儿童康复趋势的判断,从而提高对自闭症儿童康复的成效。
发明内容
本发明为了克服现有技术的缺陷,提出了一种建立自闭症儿童康复效果预测模型的方法,所述方法包含以下步骤:
步骤a:获取自闭症儿童的基本信息;
步骤b:获取自闭症儿童中残联47项指标的评估结果;
步骤c:将获取的上述基本信息和评估结果信息矢量化为特征值;
步骤d:依据上述特征进行机器学习建立模型,得到上述各项特征对于自闭症儿童康复效果的权重值,完成模型建立。
本发明采用XGBoost作为机器学习算法。所述XGBoost算法将输入的m个特征值转化为K棵树,所述模型即为每棵树的计算结果的和,其函数如下:
所述模型中有K棵树,
f
x
Obj为该树的最终模型;
Ω(f
为了让每棵树的输出结果都使模型最为准确,即,f(t)为每轮预测中最重要的,其函数如下所示:
则每轮预测中,都要尽量减小残差,残差的算法如下所示:
第t棵树对应模型
考虑方差后得:
最后得到符合上述函数的模型,并得到各项特征值的权重值。
本发明运用交叉验证技术,反复将数据集拆分为运算集和测试集,对样本进行多次模型建立,并筛选出其中结果最优的模型;所述数据集为所有儿童的30项儿童基本信息及47项特征值;
所述最优模型为根据运算集得到的模型,用测试集中的输入信息预测输出信息,其结果与测试集中的输出信息进行比对,保留正确率最高的模型;
进一步筛选最优的参数。
本发明中所述特征值为矢量数据。
本发明还提出了一种上述方法应用中建立的模型,所述模型包括多棵代表不同特征分类的弱决策树;所述样本根据其特征在每棵弱决策树上对应一个节点;所述节点对应着该棵决策树上的分数;所述样本在所有决策树上的分数加和即为该样本的特征值。
本发明还公开了一种非诊断目的的基于上述模型预测自闭症儿童康复效果的方法,所述方法包含以下步骤:
步骤I:获取自闭症儿童的基本信息;
步骤II:获取自闭症儿童中残联47项指标的评估结果;
步骤III:将获取的上述基本信息和评估结果信息矢量化为特征值;
步骤IV:将上述特征输入事先建立的模型中运算;
步骤V:得到针对该儿童自闭症康复效果的预测。
本发明还提出了一种预测自闭症儿童康复效果的系统,所述系统包含以下:
数据录入模块:包含前端网页和微信小程序,负责录入自闭症儿童的基本信息和中残联47项指标的评估结果;
数据库模块:负责储存,筛选录入的自闭症儿童基本信息及中残联47项评估指标的结果;所述筛选为根据所需要获得的模型依照模型特征对数据进行筛选;
机器学习模块:负责通过XGBoost算法学习并建立自闭症儿童康复效果预测模型,获得各项自闭症儿童特征对于自闭症儿童康复效果的权重值;
预测模块:负责将录入的自闭症儿童基本信息及中残联47项指标的评估结果代入模型中进行预测并返回康复概率实现自闭症儿童康复效果预测。
本发明的有益效果在于:
本发明可以把康复师在实际对儿童自闭症康复效果进行评估时积累的经验转化为数学模型,将儿童的数据输入本发明即可预测该儿童的自闭症康复效果。
此外,现有各类自闭症康复课程繁多,本发明可以作为一个帮助评估课程有效性的指标。
附图说明
图1是本发明特征值权值图。
图2是本发明一个含有n个数据,折叠k次的数据集。
图3是本发明随机化后的数据集。
图4是本发明第一次拆分模型计算的数据集。
图5是本发明第二次拆分模型计算的数据集。
图6是本发明第三次拆分模型计算的数据集。
具体实施方式
结合以下具体实施例和附图,对发明作进一步的详细说明。实施本发明的过程、条件、实验方法等,除以下专门提及的内容之外,均为本领域的普遍知识和公知常识,本发明没有特别限制内容。
本发明提出了一种建立自闭症儿童康复效果预测模型的方法,所述方法包含以下步骤:
步骤a:获取自闭症儿童的基本信息;
步骤b:获取自闭症儿童中残联47项指标的评估结果;
步骤c:将获取的上述基本信息和评估结果信息矢量化为特征值;
步骤d:依据上述特征进行机器学习建立模型,得到上述各项特征对于自闭症儿童康复效果的权重值,完成模型建立。
本发明还公开了一种基于上述模型预测自闭症儿童康复效果的方法,所述方法包含以下步骤:
步骤I:获取自闭症儿童的基本信息;
步骤II:获取自闭症儿童中残联47项指标的评估结果;
步骤III:将获取的上述基本信息和评估结果信息矢量化为特征值;
步骤IV:将上述特征输入事先建立的模型中运算;
步骤V:得到针对该儿童自闭症康复效果的预测。
本发明还公开了一种预测自闭症儿童康复效果的系统,所述系统包含以下:
数据录入模块:包含前端网页和微信小程序,负责录入自闭症儿童的基本信息和中残联47项指标的评估结果;
数据库模块:负责储存,筛选录入的自闭症儿童基本信息及中残联47项评估指标的结果;所述筛选为根据所需要获得的模型依照模型特征对数据进行筛选(例:若只想研究上海儿童的情况,则筛选出上海儿童的数据,得到上海儿童的模型);
机器学习模块:负责通过XGBoost算法学习并建立自闭症儿童康复效果预测模型,获得各项自闭症儿童特征对于自闭症儿童康复效果的权重值;
预测模块:负责将录入的自闭症儿童基本信息及中残联47项指标的评估结果代入模型中进行预测并返回康复概率实现自闭症儿童康复效果预测。
本发明还提出了一种上述方法应用中建立的模型,所述模型包括多棵代表不同特征分类的弱决策树;所述样本根据其特征在每棵弱决策树上对应一个节点;所述节点对应着该棵决策树上的分数;所述样本在所有决策树上的分数加和即为该样本的特征值。
在步骤d中,采用XGBoost算法作为建立机器学习预测自闭症儿童康复效果模型的机器学习算法。XGBoost是梯度提升树(GDBT)算法的增强算法,其核心在于回归树(CART)。XGBoost会将我们输入的m个特征值转化为K棵树,模型即为每棵树的计算结果的和,其函数如下:
所述模型中有K棵树,
f
x
Obj为该树的最终模型;
Ω(f
在建模方法中,为了让每棵树的输出结果都使模型最为准确,即,f(t)为每轮预测中最重要的,其函数如下所示:
则每轮预测中,都要尽量减小残差,残差的算法如下所示:
第t棵树对应模型
考虑方差后可得:
最后得到符合上述函数的模型,并得到各项特征值的权重值。
在步骤d中,为了让模型尽可能普适,运用了交叉验证(Cross Validation)技术,反复将数据集拆分为运算集和测试集。假设有一含有n个数据,折叠k次的数据集;先将数据集进行随机化,然后进行连续三次拆分模型计算。
可见,折叠三次可以对样本进行三次模型建立,并可以筛选出其中结果最优的模型,从而进一步筛选最优的参数。
在实际的运算中,随机拆分了30%总样本的样本数据作为测试集,将测试集的结果与对测试集的预测结果进行反复比对,最后反复验证计算出最合适的参数,从而计算出最准确的模型。
建模方法中,算法要求输入的数据为矢量数据,则需要对数据进行整理(步骤c),具体细则依下表:
在步骤d中,对于自闭症儿童康复效果的判定基于该儿童中残联47个评估点的评估结果总分判定,若该儿童康复训练后评估总分高于训练前评估总分,则认定该儿童的康复有效果,反之则表示无效。
本发明的保护内容不局限于以上实施例。在不背离发明构思的精神和范围下,本领域技术人员能够想到的变化和优点都被包括在本发明中,并且以所附的权利要求书为保护范围。
机译: 无谷蛋白饮食的自闭症儿童行为障碍有效性预测方法
机译: 建立预测模型的装置和方法,建立预测模型的程序以及计算机可读存储介质
机译: 基于机器学习心脏病预测模型建筑方法的心脏病预测模型建筑装置用机器学习方法和计算机程序建立的模型输出心脏病的心脏病测量装置,用于执行方法