首页> 中国专利> 基于机器学习的老年人营养健康状态评估与风险预测系统

基于机器学习的老年人营养健康状态评估与风险预测系统

摘要

本发明公开了一种基于机器学习的老年人营养健康状态评估与风险预测系统。该系统包括数据获取与特征筛选模块、营养健康状态评估模型构建模块、风险预测模块、营养健康状态分析与建议模块;本发明结合大数据与机器学习算法,纳入分析膳食信息、机体功能状态、生物标志物等营养健康状态相关的多维度特征,构建了基于CatBoost的营养健康状态评估模型,将人群划分为高、中、低、健康人群以提供风险预测信息,进而通过机器学习可解释技术提供个性化建议;本发明能够助力老年人实时而快速地掌握自身的营养健康状态,促进医疗保健人员对老年人营养健康状态的干预。

著录项

  • 公开/公告号CN114974570A

    专利类型发明专利

  • 公开/公告日2022-08-30

    原文格式PDF

  • 申请/专利权人 浙江大学;

    申请/专利号CN202210619646.2

  • 申请日2022-05-27

  • 分类号G16H50/20(2018.01);G16H50/30(2018.01);G16H50/80(2018.01);

  • 代理机构杭州求是专利事务所有限公司 33200;

  • 代理人刘静

  • 地址 310058 浙江省杭州市西湖区余杭塘路866号

  • 入库时间 2023-06-19 16:33:23

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-16

    实质审查的生效 IPC(主分类):G16H50/20 专利申请号:2022106196462 申请日:20220527

    实质审查的生效

说明书

技术领域

本发明属于医疗健康信息技术领域,具体涉及一种基于机器学习的老年人营养健康状态评估与风险预测系统。

背景技术

人口老龄化已成为世界性的社会问题,2021年中国第七次全国人口普查结果显示,中国60岁及以上人口占比超18%,而预计2050年该比例将攀升至31%,65岁以上老人的比例将扩大到总人口的四分之一。伴随着人口老龄化,家庭与社会负担日益加重,社会保障支出压力持续加大,养老和健康服务供需矛盾更加突出,因此,提高老年人的健康服务和管理水平已成为了当前医疗健康领域的重要议题。

关注老年人的医疗健康,不仅需要探索前沿的疾病治疗方法,更重要的是日常营养健康状态的监测与护理。营养健康状态,包括个体的饮食习惯、营养水平以及各项生理指标,是身体机能的潜在表征,能够反映个体当前的生存状态,而对于老年人而言,营养健康状态往往也体现了其整体的生存风险。因此,准确评估老年人的营养健康状态,进而对其进行风险评估与营养管理,将对于提升老年人的健康服务水平具有重大的推动作用。

为深入探究老年人营养健康状态的相关风险因素,一系列针对老年人群体的大型队列数据为老年人健康研究提供了丰富而详实的数据基础,例如北京大学“中国老年健康影响因素跟踪调查”(Chinese Longitudinal Healthy Longevity Survey,CLHLS),1998-2018年在中国23个省/市/自治区随机抽取大约一半县市进行八次跟踪调查,累计入户访问11.3万人,调查涉及内容包括个体的生活状态、饮食习惯、营养状态以及各项生理指标。同时,日益发展的机器学习算法能够通过数据驱动的方式,从大数据中自动挖掘出相关的模式信息,因此已广泛应用于各项医疗健康领域的评估方法建立。

现有相关研究中已有的营养健康状态评估方法,如Detsky等人[1]提出的SGA评分,Kondrup等人[2]提出的NRS评分,Weekes等人[3]提出的MUST评分,Kruizenga等人[4]提出的SNAQ评分,上述评分仅纳入了体重下降、BMI、食物摄入等营养指标,而且主要面向成年人群,未针对老年人群进行优化调整;适用于老年人群体的MST评分[5]和MNA-SF评分[6],所纳入的指标仅有体重下降与营养摄入等简单指标。

同时,现有相关技术方案中亦存在一些局限:如授权公开号为CN102902881B的“一种肠外营养筛查计算系统”,仅是针对不同人群采用不同的营养评分方式(NRS、MUST、MNA、SGA),而未提出新的评分方式;如授权公开号为CN108877936B的“健康评估方法、系统及计算机可读存储介质”,以心脑血管系统功能为核心指征进行建模,但其方案主要针对的是慢性代谢性疾病发展模型;如授权公开号为CN111445980A的“膳食方案反应性预测模型及建模方法、电子设备”,主要针对的是膳食方案的评估,缺乏对当前个体营养状态的评估以及后续风险的预测分析。

综上,现有的相关研究与技术方案中存在以下问题:

1.大多营养评价指标建立于整体成年人群数据,而并未对老年人群进行进一步调整优化,因此在老年人群中的适用性较差;

2.所纳入的信息较为有限,主要为人口学信息、体重变化等基础特征,一方面,未纳入营养习惯、机体功能状态信息,也鲜有客观的生理指标或生物标志物;另一方面,各指标主要于1990至2005年间提出,存在滞后性,未纳入新的一些生物标志物信息,难以具体地、量化地、全面地评价机体的营养健康状态;

3.方法实施主要依据问卷或评分量表方式,具体的计算方法和公式较为繁琐,所需时长由3至15分钟不等,同时,部分量表还需专业医护人员或营养保健人员评估;

4.方法输出结果主要为营养状态的整体评价,未对当前的营养状态提供建议,更未对后续生存风险进行评估预测。

参考文献:

[1].Detsky,A.S.,et al.,What Is Subjective Global Assessment ofNutritional-Status.Journal of Parenteral and Enteral Nutrition,1987.11(1):p.8-13.

[2].Kondrup,J.,Nutritional risk screening(NRS 2002):a new methodbased on an analysis of controlled clinical trials.Clinical Nutrition,2003.22(3):p.321-336.

[3].Weekes,C.E.,M.Elia,and P.W.Emery,The development,validation andreliability of a nutrition screening tool based on the recommendations of theBritish Association for Parenteral and Enteral Nutrition(BAPEN).Clin Nutr,2004.23(5):p.1104-12.

[4].Kruizenga,H.M.,et al.,Development and validation of a hospitalscreening tool for malnutrition:the short nutritional assessmentquestionnaire(SNAQ).Clin Nutr,2005.24(1):p.75-82.

[5].Ferguson,M.,et al.,Development of a valid and reliablemalnutrition screening tool for adult acute hospital patients.Nutrition,1999.15(6):p.458-464.

[6].Rubenstein,L.Z.,et al.,Screening for undernutrition in geriatricpractice:Developing the Short-Form Mini-Nutritional Assessment(MNA-SF).Journals of Gerontology Series a-Biological Sciences and Medical Sciences,2001.56(6):p.M366-M372.

发明内容

鉴于上述,本发明的目的在于针对老年人群体提出一种基于机器学习的营养健康状态评估与风险预测系统,结合详实可靠的队列大数据与机器学习算法,纳入分析营养健康状态相关的多维度特征,实际应用时无需额外指导与复杂的公式计算,只需输入当前状态信息即可快速得到分析结果,从而助力老年人实时掌握自身的营养健康状态,促进医疗保健人员对老年人营养健康状态的管理与干预。

本发明的目的是通过以下技术方案来实现的:一种基于机器学习的老年人营养健康状态评估与风险预测系统,包括:

(1)数据获取与特征筛选模块:

获取大规模的老年人健康因素相关的队列数据,初步确定所能纳入的所有特征信息;提炼临床常用的各项相关指标与营养健康专家知识,筛选得到可用的有效特征,构建结构化的特征集并进行预处理;

(2)营养健康状态评估模型构建模块:

以数据获取与特征筛选模块得到的特征为输入,以样本的死亡时间为真实标签,构建数据集;通过CatBoost构建营养健康状态评估模型,同时采取交叉验证的方式验证模型的泛化性,通过网格搜索调优模型参数提高其综合性能;通过序列浮动后向选择算法对全部有效特征进一步筛选,减少特征数以提高实用性;

(3)风险预测模块:

以营养健康状态评估模型为基础,设定相应阈值划分人群为健康、低风险、中风险、高风险人群,进而根据人群区分与真实的生存信息,绘制生存曲线;实际应用时,无需额外指导与公式计算,只需输入当前个体的各项指征,通过营养健康状态评估模型的运算即得到相应的评分,划分为对应人群,并对照相应的生存曲线了解后续风险;

(4)营养健康状态分析与建议模块

以营养健康状态评估模型为基础,在个体进行营养健康状态评估时,通过SHAP算法对具体的特征指标进行详细分析,了解各个特征重要性以及对结果的影响,进而提供更具体而精确的建议。

进一步地,在数据获取与特征筛选模块中,采用的有效特征包括:

1.基本信息:年龄、性别、死亡信息;

2.人体测量信息:身高、体重、小腿围、右膝至地面距离、腰围;

3.机体功能状态信息:是否需要辅助洗澡、是否需要辅助穿衣、是否需要辅助排泄、是否需要辅助室内移动、是否需要辅助进食、是否失禁、能否独立拜访邻居、能否独立购物、能否独立烹饪、能否独立洗衣、能否持续行走1公里、能否举起5千克重物、能否连续蹲伏和站立3次、能否乘坐公共交通工具、能否从座椅中站起、能否从地上捡起书、能否将手放在颈后、能否将手放在下背部、能否向上举起手臂;

4.膳食信息:新鲜水果食用频率、新鲜蔬菜食用频率、肉类食用频率、鱼等水产品食用频率、蛋类食用频率、豆制品食用频率、腌咸菜或泡菜食用频率、白糖或糖果食用频率、茶食用频率、大蒜食用频率、奶制品食用频率、坚果食用频率、菌藻类食用频率;

5.生活质量信息:个人生活质量自评、个人健康状态自评;

6.生物标志物-血浆生化检查:白蛋白、血尿素氮、胆固醇、肌酐、超敏C-反应蛋白、血糖、糖化血清蛋白、高密度脂蛋白胆固醇、低密度脂蛋白胆固醇、甘油三酯、尿酸、超氧化物歧化酶(SOD)活性、维生素d3、丙二醛、维生素b12;

7.生物标志物-尿液指标:尿微量白蛋白、尿肌酐、尿清蛋白/尿肌酐;

8.生物标志物-血常规检查:白细胞计数、淋巴细胞计数、淋巴细胞百分比、红细胞计数、血红蛋白浓度、红细胞压积、平均红细胞体积、平均红细胞血红蛋白含量、平均红细胞血红蛋白浓度、血小板计数、平均血小板体积、血小板体积分布宽度、血小板压积。

进一步地,在数据获取与特征筛选模块中,预处理时需结合数据文档标记缺失值,从而剔除缺失指标比例大于p的部分样本,同时,进行数据分布分析,剔除异常值,保证数据的合理分布;进而,针对存在部分缺失值的样本,通过K近邻进行空值填充;其中p取50%,K近邻的参数K为5,K近邻的权重函数为欧氏距离。

进一步地,营养健康状态评估模型构建模块中,将特征集矩阵化为原始数据集(X,Y),X=[x

进一步地,在营养健康状态评估模型构建模块中,由于特征集变量多且关系复杂,且存在较多分类数量,采用能够对分类变量进行无偏处理的提升树模型CatBoost进行建模;在处理类别型特征时,采用Greedy TS(Target-based Statistics)策略对其进行处理,即通过添加先验分布项做平滑处理,消除低频率类别型数据以及噪声数据对于数据集分布的影响,具体为:对样本集X进行随机排序,序列记为σ=(σ

其中,D={(x

进一步地,在营养健康状态评估模型构建模块中,为避免梯度提升树模型训练时产生的预测偏移(Prediction shift),采取排序提升的方式减少梯度偏差,即:设模型的最大迭代数为T,在每一轮迭代t中,对所有样本进行随机排序得到序列σ=(σ

r

其中,σ(i)表示样本i在本轮的排序,M

进一步地,在营养健康状态评估模型构建模块中,为充分利用数据并验证模型的健壮性,采取交叉验证的方式划分训练集与测试集进行模型的训练和验证,其中交叉验证的折数为5;同时,通过网格搜索模型的参数空间,寻找最优参数提高模型性能,搜索的参数范围包括:树的数量、学习率、树的深度、Bootstrap类型、Bagging温度、树生长策略、L2正则参数;以F1为优化目标进行参数搜索:

F1=(2×precision×recall)/(precision+recall)

其中,precision为预测精度,recall为预测召回率;最终,通过在训练集上的参数搜索与交叉验证,构建性能最优的营养健康状态评估模型,并在测试集上进行测试,评价指标为受试者曲线与精度-召回率曲线。

进一步地,在营养健康状态评估模型构建模块中,由于全部有效特征数量较多,采取序列浮动后向选择算法对全部有效特征进行进一步筛选;全部有效特征集为D=[d

进一步地,在营养健康状态评估模型构建模块中,筛选得到的重要特征集合包括15项:年龄、性别、小腿围、右膝到地面长度、白蛋白、糖化血清蛋白、低密度脂蛋白胆固醇、超氧化物歧化酶(SOD)活性、尿清蛋白/尿肌酐、淋巴细胞百分比、能否乘坐公共交通工具、能否从地上捡起书、新鲜蔬菜食用频率、肉类食用频率、鱼等水产品食用频率。

进一步地,在风险预测模块中,设定阈值t1、t2、t3,营养健康状态评估模型得分为t,则t≥t1为高风险人群,t2≤t<t1为中风险人群,t3≤t<t2为低风险人群,t<t3为健康人群;将总体人群分为不同风险人群后,针对不同风险人群通过Kaplan-Meier法绘制生存曲线,作为不同风险人群的预后风险信息;其中t1为0.75,t2为0.5,t3为0.25。

进一步地,在营养健康状态分析与建议模块中,结合前述构建的营养健康状态评估模型与SHAP算法(SHapley Additive exPlanations)构建营养状态个性化分析模型,SHAP将营养状态个性化分析模型的预测值解释为每个输入特征的归因值之和,由于建立的是CatBoost树型模型即:

其中,g为营养状态个性化分析模型,x

其中,{x

进一步地,在营养健康状态分析与建议模块中,在个体进行营养健康状态评估时,通过对当前个体的评估结果以及各个特征进行分析,确定当前的风险因素和保护因素,从而提供营养健康建议。

本发明的有益效果是:

1.本发明针对老年人群体,依托大数据与营养健康领域的临床知识与专家经验,初步筛选了有效特征集,涵盖基本信息、人体测量信息、膳食信息、生活质量信息、生物标志物-血浆生化检查、生物标志物-尿液指标、生物标志物-血常规检查,从而能够对个体的营养健康状态进行全面和准确的表示;而后进一步通过机器学习算法筛选得到了更聚焦的重要特征,而通过15个特征,即构建了性能卓越的营养健康状态评估模型,证明了这部分指标对营养健康状态的优异表示能力;

2.本发明结合筛选的相关特征与机器学习算法构建了营养健康状态评估模型,不仅针对队列数据分类特征较多的数据特点,采用了能够对分类数据进行无偏处理的CatBoost算法,同时,结合交叉验证与网格搜索进行超参数调优,进一步提高了模型性能;构建得到的模型性能优异,同时不再需要专业人士的评估和费时的公式计算,输入数据即可迅速获得相应的评估结果,15个特征输入仅需30秒,系统计算与评估仅需1秒,具有更好的推广性和实用性;

3.本发明结合队列数据与构建模型对总体老年人群进行细分,根据相应阈值分为高风险人群、中风险人群、低风险人群以及健康人群,并针对每个人群进行了生存分析,得到了准确的生存曲线,为不同人群提供了预后信息,助力个体对自身营养健康状态的整体了解;

4.本发明依托于构建的模型与机器学习可解释技术SHAP算法,对个体营养健康状态相关的特征进行了分析,了解哪些指标指向了不良预后,从而加强了个体对自身营养健康状态的认识,促进医疗保健人员对老年人营养健康的管理。

附图说明

图1是本发明系统结构框图。

图2是本发明实施例构建的营养健康状态评估模型在测试集上的受试者曲线。

图3是本发明实施例构建的营养健康状态评估模型在测试集上的精度-召回率曲线。

图4是本发明实施例构建的风险预测模块中不同营养健康状态对应的生存曲线。

图5是本发明实施例构建的营养健康状态分析与建议模块中各因素影响的分析图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其它不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。

本实施例提供了一种基于机器学习的老年人营养健康状态评估与风险预测系统,包括:

(1)数据获取与特征筛选模块:

获取大规模的老年人健康因素相关的队列数据,初步确定所能纳入的所有特征信息;提炼临床常用的各项相关指标与营养健康专家知识,筛选得到可用的有效特征,构建结构化的特征集并进行预处理;

(2)营养健康状态评估模型构建模块:

以数据获取与特征筛选模块得到的特征为输入,以样本的死亡时间为真实标签,构建数据集;通过CatBoost构建营养健康状态评估模型,同时采取交叉验证的方式验证模型的泛化性,通过网格搜索调优模型参数提高其综合性能;通过序列浮动后向选择算法对全部有效特征进一步筛选,减少特征数以提高实用性;

(3)风险预测模块:

以营养健康状态评估模型为基础,设定相应阈值划分人群为健康、低风险、中风险、高风险人群,进而根据人群区分与真实的生存信息,绘制生存曲线;实际应用时,无需额外指导与公式计算,只需输入当前个体的各项指征,通过营养健康状态评估模型的运算即得到相应的评分,划分为对应人群,并对照相应的生存曲线了解后续风险;

(4)营养健康状态分析与建议模块

以营养健康状态评估模型为基础,在个体进行营养健康状态评估时,通过SHAP算法对具体的特征指标进行详细分析,了解各个特征重要性以及对结果的影响,进而提供更具体而精确的建议。

进一步的,在数据获取与特征筛选模块中,采用的有效特征包括:

1.基本信息:年龄、性别、死亡信息;

2.人体测量信息:身高、体重、小腿围、右膝至地面距离、腰围;

3.机体功能状态信息:是否需要辅助洗澡、是否需要辅助穿衣、是否需要辅助排泄、是否需要辅助室内移动、是否需要辅助进食、是否失禁、能否独立拜访邻居、能否独立购物、能否独立烹饪、能否独立洗衣、能否持续行走1公里、能否举起5千克重物、能否连续蹲伏和站立3次、能否乘坐公共交通工具、能否从座椅中站起、能否从地上捡起书、能否将手放在颈后、能否将手放在下背部、能否向上举起手臂;

4.膳食信息:新鲜水果食用频率、新鲜蔬菜食用频率、肉类食用频率、鱼等水产品食用频率、蛋类食用频率、豆制品食用频率、腌咸菜或泡菜食用频率、白糖或糖果食用频率、茶食用频率、大蒜食用频率、奶制品食用频率、坚果食用频率、菌藻类食用频率;

5.生活质量信息:个人生活质量自评、个人健康状态自评;

6.生物标志物-血浆生化检查:白蛋白、血尿素氮、胆固醇、肌酐、超敏C-反应蛋白、血糖、糖化血清蛋白、高密度脂蛋白胆固醇、低密度脂蛋白胆固醇、甘油三酯、尿酸、超氧化物歧化酶(SOD)活性、维生素d3、丙二醛、维生素b12;

7.生物标志物-尿液指标:尿微量白蛋白、尿肌酐、尿清蛋白/尿肌酐;

8.生物标志物-血常规检查:白细胞计数、淋巴细胞计数、淋巴细胞百分比、红细胞计数、血红蛋白浓度、红细胞压积、平均红细胞体积、平均红细胞血红蛋白含量、平均红细胞血红蛋白浓度、血小板计数、平均血小板体积、血小板体积分布宽度、血小板压积。

进一步地,在数据获取与特征筛选模块中,预处理时需结合数据文档标记缺失值,从而剔除缺失指标比例大于p的部分样本,同时,进行数据分布分析,剔除异常值,保证数据的合理分布;进而,针对存在部分缺失值的样本,通过K近邻进行空值填充;其中p取50%,K近邻的参数K为5,K近邻的权重函数为欧氏距离。

进一步地,营养健康状态评估模型构建模块中,将特征集矩阵化为原始数据集(X,Y),X=[x

进一步地,在营养健康状态评估模型构建模块中,由于特征集变量多且关系复杂,且存在较多分类数量,采用能够对分类变量进行无偏处理的提升树模型CatBoost进行建模;在处理类别型特征时,采用Greedy TS(Target-based Statistics)策略对其进行处理,即通过添加先验分布项做平滑处理,消除低频率类别型数据以及噪声数据对于数据集分布的影响,具体为:对样本集X进行随机排序,序列记为σ=(σ

其中,D={(x

进一步地,在营养健康状态评估模型构建模块中,为避免梯度提升树模型训练时产生的预测偏移(Prediction shift),采取排序提升的方式减少梯度偏差,即:设模型的最大迭代数为T,在每一轮迭代t中,对所有样本进行随机排序得到序列σ=(σ

r

其中,σ(i)表示样本i在本轮的排序,M

进一步地,在营养健康状态评估模型构建模块中,为充分利用数据并验证模型的健壮性,采取交叉验证的方式划分训练集与测试集进行模型的训练和验证,其中交叉验证的折数为5;同时,通过网格搜索模型的参数空间,寻找最优参数提高模型性能,搜索的参数范围包括:树的数量、学习率、树的深度、Bootstrap类型、Bagging温度、树生长策略、L2正则参数;以F1为优化目标进行参数搜索:

F1=(2×precision×recall)/(precision+recall)

其中,precision为预测精度,recall为预测召回率;最终,通过在训练集上的参数搜索与交叉验证,构建性能最优的营养健康状态评估模型,并在测试集上进行测试,评价指标为受试者曲线与精度-召回率曲线。

进一步地,在营养健康状态评估模型构建模块中,由于全部有效特征数量较多,采取序列浮动后向选择算法对全部有效特征进行进一步筛选;全部有效特征集为D=[d

进一步地,在营养健康状态评估模型构建模块中,筛选得到的重要特征集合包括15项:年龄、性别、小腿围、右膝到地面长度、白蛋白、糖化血清蛋白、低密度脂蛋白胆固醇、超氧化物歧化酶(SOD)活性、尿清蛋白/尿肌酐、淋巴细胞百分比、能否乘坐公共交通工具、能否从地上捡起书、新鲜蔬菜食用频率、肉类食用频率、鱼等水产品食用频率。

进一步地,在风险预测模块中,设定阈值t1、t2、t3,营养健康状态评估模型得分为t,则t≥t1为高风险人群,t2≤t<t1为中风险人群,t3≤t<t2为低风险人群,t≤t3为健康人群;将总体人群分为不同风险人群后,针对不同风险人群通过Kaplan-Meier法绘制生存曲线,作为不同风险人群的预后风险信息;其中t1为0.75,t2为0.5,t3为0.25。

进一步地,在营养健康状态分析与建议模块中,结合前述构建的营养健康状态评估模型与SHAP算法(SHapley Additive exPlanations)构建营养状态个性化分析模型,SHAP将营养状态个性化分析模型的预测值解释为每个输入特征的归因值之和,由于建立的是CatBoost树型模型即:

其中,g为营养状态个性化分析模型,x

其中,{x

进一步地,在营养健康状态分析与建议模块中,在个体进行营养健康状态评估时,通过对当前个体的评估结果以及各个特征进行分析,确定当前的风险因素和保护因素,从而提供营养健康建议。

图1是本发明系统结构框图。

图2是本发明构建的营养健康状态评估模型在测试集上的受试者曲线。通过本发明构建的营养健康状态评估模型,输入测试集的样本数据,得到模型评估的具体概率,根据不同的阈值对测试数据的类别进行判别,从而绘制ROC;其中,横坐标为假阳性率,纵坐标为真阳性率,ROC的曲线下面积(Area under curve,AUC)可作为性能评估的客观指标,越高则代表模型对不同类样本的判别能力;最终,本发明构建的营养健康状态评估模型的AUC-ROC达到0.8329,证明了其卓越的性能。

图3是本发明构建的营养健康状态评估模型在测试集上的精度-召回率曲线。通过本发明构建的营养健康状态评估模型,输入测试集的样本数据,得到模型评估的具体概率,根据不同的阈值对测试数据的类别进行判别,从而绘制PRC;其中,横坐标为召回率,纵坐标为精度,PRC的AUC可作为性能评估的客观指标,越高则代表模型对不同类样本的判别能力;最终,本发明构建的营养健康状态评估模型的AUC-PRC达到0.7125,证明了其卓越的性能。

图4是本发明构建的风险预测模块中不同营养健康状态对应的生存曲线。每一条曲线都对应着相应风险人群的生存曲线;其中横坐标为生存率,纵坐标为时间线/天,总长度为5年(1826天);通过图示,能够明显看到不同风险人群的生存曲线差异较大,且风险越大其生存曲线越差,证明所构建的模型对人群的区分符合数据真实情形,具有较好的指示作用。

图5是本发明构建的营养健康状态分析与建议模块中各因素影响的分析图(以单个测试数据为例)。纵轴上为每一个特征的相应取值,以对结果的重要性影响而从上到下排序,其中取值及其划分为:年龄(岁)、性别(男性/女性)、小腿围(厘米)、右膝到地面长度(厘米)、白蛋白(g/L)、糖化血清蛋白(μmol/L)、低密度脂蛋白胆固醇(mmol/L)、超氧化物歧化酶活性(IU/ml)、尿清蛋白/尿肌酐(%)、淋巴细胞百分比(%)、能否乘坐公共交通工具(能/有一定困难/不能)、能否从地上捡起书(能/不能)、新鲜蔬菜食用频率(每天/经常/有时/很少或从不)、肉类食用频率(几乎每天/每周至少一次/每月至少一次/不是每月但有时/很少或从不)、鱼等水产品食用频率(几乎每天/每周至少一次/每月至少一次/不是每月但有时/很少或从不);横轴为每一个特征对结果的影响,存在正负;E[f(X)]代表数据集的期望输出,f(x)代表模型的当前输出;通过图示,能够分析当前样本的营养健康状态较差,主要的风险因素为年龄较大、无法乘坐公共交通、低密度脂蛋白胆固醇含量低、白蛋白含量低等,因此需要针对可改进的方面进行调整,如营养摄入、饮食习惯等。

以上所述仅是本发明的优选实施方式,虽然本发明已以较佳实施例披露如上,然而并非用以限定本发明。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何的简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号