首页> 中国专利> 一种基于多数据分析模型的艾滋病防治决策方法

一种基于多数据分析模型的艾滋病防治决策方法

摘要

本发明公开了一种基于多数据分析模型的艾滋病防治决策方法,该防治决策方法具体步骤如下:步骤一:建立基础数据收集模型;步骤二:对步骤一中收集到的基础数据应用统计学中的描述统计,并根据相应指标构建分析统计模型,得到描述性图表;步骤三:对步骤二中的描述性图表进行监控,选择描述性图表中所包含不同类别的属性的特征信息,形成特征分类集合;步骤四:采用决策树算法对特征分类集合进行决策树构建,并根据特征评估标准,从上至下递归地生成子节点,得到辅助决策措施;该防治决策方法为艾滋病防治工作提供辅助依据,同时对艾滋病的防治进行针对性的跟进,有的放矢,有利于更好的实现艾滋病防治的目标。

著录项

说明书

技术领域

本发明涉及艾滋病病毒感染者和病人综合管理工作领域,具体为一种基于多数据分析模型的艾滋病防治决策方法。

背景技术

数据分析是艾滋病病毒感染者和病人综合管理工作的重要组成部分,目前,大部分艾滋病随访责任人每个月均要对感染者和病人综合管理进展采用手工计算方式进行,并整理CD4未检测、配偶未检测、结核病未检查名单等数据库用于指导工作,该项工作所需时间较长,同时基层随访责任人承担工作较多,不能及时对辖区内相关数据及时分析,导致艾滋病防治工作的开展进度较缓。

现有的基于多数据分析模型的艾滋病防治决策方法,对感染者和病人综合管理进展均采用手工计算方式进行,该方法工作所需时间较长,同时基层随访责任人承担工作较多,不能及时对辖区内相关数据及时分析,导致艾滋病防治工作的开展进度较缓,为此,我们提出一种基于多数据分析模型的艾滋病防治决策方法。

发明内容

本发明的目的在于提供一种基于多数据分析模型的艾滋病防治决策方法,以解决上述背景技术中提出的现有的基于多数据分析模型的艾滋病防治决策方法,对感染者和病人综合管理进展均采用手工计算方式进行,该方法工作所需时间较长,同时基层随访责任人承担工作较多,不能及时对辖区内相关数据及时分析,导致艾滋病防治工作的开展进度较缓的问题。

为实现上述目的,本发明提供如下技术方案:一种基于多数据分析模型的艾滋病防治决策方法,该防治决策方法具体步骤如下:

步骤一:建立基础数据收集模型,用于对艾滋病病人基础数据进行收集;

步骤二:对步骤一中收集到的基础数据应用统计学中的描述统计,计算出相应指标,并根据相应指标构建个案流调、PITC、治疗转介和三类人群ART进展数据的分析统计模型,得到病人数据、个案流调数据、PITC信息、治疗转介信息和三类人群ART进展数据的描述性图表;

步骤三:对步骤二中的描述性图表进行监控,选择描述性图表中所包含不同类别的属性的特征信息,形成特征分类集合;

步骤四:采用决策树算法对特征分类集合进行决策树构建,并根据特征评估标准,从上至下递归地生成子节点,直到数据集不可分则停止决策树停止生长,得到辅助决策措施。

优选的,所述基础数据包括人员信息、家庭住址、感染途径、是否收监和是否存活;所述描述性图表的表现形式包括直方图、折线图和饼状图;所述相应指标包括平均值、算术和、均值、众数、方差、标准差、最大值和最小值;所述特征信息包括CD4检测、个案流调、治疗转介、抗病毒治疗及PITC艾滋病检测咨询服务;所述辅助决策措施包括固化指标数据预警、个案流调率异常预警、PITC信息异常预警、治疗转介信息异常预警、治疗提醒、随访提醒、配偶阳转提醒、死亡提醒、羁押释放提醒等指标预警和消息推送;所述决策树具体为单模型数据或多模型数据之间的决策树。

优选的,步骤二所述应用统计学中的描述统计,计算出相应指标的具体步骤如下:

(1)均值计算:通过均值计算,统计出不同的分类指标,其中,均值计算公式如下:

由此得出:在当前环境下,各分类指标的观测值相对集中较多的中心位置,以此

(2)方差和标准差计算:基于(1)中的均值公式,计算方差,统计指标数据的偏离程度,其中方差和标准差计算公式如下:

方差:

标准差:

由此得出:方差s2越小,表示指标数据偏离程度越小;表明该地区的CD4监测率波动较大,分析原因,可能为HIV传播率较大;同时利用计算的方差求出标准差,以标准差决定直方图、折线图的坐标区间,使数据展示图更为清晰;

(3)众数查找:是指在统计分布上具有明显集中趋势点的数值,即出现次数最多的值;该方法使用二叉搜索树算法,找出出现频率最高的数据,步骤如下:

①遍历二叉树,用哈希表来计数;

②进行中序遍历后的序列是有序序列,在中序遍历时求众数;

(4)最大值和最小值查找:

通过顺序查找算法,查找出不同地区或不同时段内的最大值和最小值,分析在区域或时段维度的工作情况指标数据。

优选的,所述特征分类集合包括将个案流调形成确诊、感染、正常的诊断信息特征分类集合、划分个案流调率区间,根据不同区间值形成个案流调率特征分类集合、按转介信息形成转介、脱失、入组人员信息及脱失、未转介、未入组的特征分类集合以及根据ART进展情况形成治疗与未治疗的特征分类集合。

优选的,所述决策树算法思路如下:

S1:从根节点开始,按照训练数据的每个特征进行计算,根据每个特征的不确定性将训练数据分配到其子节点(分支),沿着该分支可能达到叶子节点或者到达另一个内部节点;

S2:对剩余的特征递归执行下去,直到抵达一个叶子节点;当都到达叶子节点时,即得到决策树。

优选的,所述决策树中利用类别熵(H(c))以及特征条件熵(H(c|x)),同时在此基础上计算信息增益(G(x)),在建立决策树的过程中,一个特征的信息增益越大,表明特征对样本的熵减少的能力越强,这个特征使得数据由不确定性变成确定性的能力越强;在多个类别的情况下,比较不同类别的信息增益,取信息增益值最大的类别作为根节点进行分裂,生成决策树;其公式如下:

G(x)=H(c)-H(c|x) (2)。

优选的,所述决策树的生成包括以下步骤:

SS1:特征选择:特征选择是指从训练数据的特征中选择一个特征作为当前节点的分裂点;

SS2:训练数据集:该数据集是不同特征分类集合中的某一个特征与另一个或多个特征分类集合其中一个特征所形成的集合,其中,所形成的每条数据集都对应一个决策依据,形成的决策依据用于对病人和医务人员进行未治疗提醒;根据训练的样本数据集形成的决策依据,用于为决策树的学习提供模板;

SS3:生成决策树:根据选择的特征评估标准,从上至下递归地生成子节点,将进一步进行决策树的完善,用同样的方式,针对剩余的三个纬度进行计算,直到数据集不可分则停止决策树生长。

优选的,所述分裂点包括ART进展情况形成治疗和未治疗的特征分类集合;所述决策依据包括PITC诊断信息特征分类集合中的确诊特征+转介信息特征集合中的入组特征+ART进展特征中的未治疗。

与现有技术相比,本发明的有益效果是:该基于多数据分析模型的艾滋病防治决策方法提出一种针对综合管理乡镇数据自动计算、统计分析、个案流调数据分析统计、PITC数据计算分析统计、抗病毒治疗转介信息的管理及统计分析、三类人群数据计算及统计分析、数据质量控制、其它报表及定时提醒信息推送等艾滋病防治所需工作的辅助决策方法,其中辅助决策措施包括固化指标数据预警、个案流调率异常预警、PITC信息异常预警、治疗转介信息异常预警、治疗提醒、随访提醒、配偶阳转提醒、死亡提醒、羁押释放提醒等指标预警和消息推送,从而实现了艾滋病感染者和病人综合管理相关指标的自动计算,进而有利于及时为随访责任人提供数据分析服务,并且有效控制了传染源,减少了新感染;

该基于多数据分析模型的艾滋病防治决策方法由基础数据收集模型、应用统计学中的描述统计建立的个案流调数据统计分析模型、PITC信息统计分析模型、治疗转介信息统计分析模型、三类人群ART进展数据统计分析模型、基于决策树的艾滋病病人及医务工作者的信息预警与提醒方法组成;通过多数据分析模型得到艾滋病病毒感染者和病人的基础信息、转介信息、抗病毒治疗信息及医务人员在医疗服务中主动为就诊者提供艾滋病检测咨询服务的信息,并采用决策算法为艾滋病防治工作提供辅助决策的依据,从而有利于对艾滋病防治工作进行有针对性的跟进,以及有利于更好的实现艾滋病防治的总目标。

附图说明

图1是本发明整体结构示意图;

图2是本发明决策树算法的流程图;

图3是本发明决策树的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1-3,本发明提供一种技术方案:一种基于多数据分析模型的艾滋病防治决策方法,该防治决策方法具体步骤如下:

步骤一:建立基础数据收集模型,用于对艾滋病病人基础数据进行收集;

步骤二:对步骤一中收集到的基础数据应用统计学中的描述统计,计算出相应指标,并根据相应指标构建个案流调、PITC、治疗转介和三类人群ART进展数据的分析统计模型,得到病人数据、个案流调数据、PITC信息、治疗转介信息和三类人群ART进展数据的描述性图表;

步骤三:对步骤二中的描述性图表进行监控,选择描述性图表中所包含不同类别的属性的特征信息,形成特征分类集合;

步骤四:采用决策树算法对特征分类集合进行决策树构建,并根据特征评估标准,从上至下递归地生成子节点,直到数据集不可分则停止决策树停止生长,得到辅助决策措施。

基础数据包括人员信息、家庭住址、感染途径、是否收监和是否存活;描述性图表的表现形式包括直方图、折线图和饼状图;相应指标包括平均值、算术和、均值、众数、方差、标准差、最大值和最小值;特征信息包括CD4检测、个案流调、治疗转介、抗病毒治疗及PITC艾滋病检测咨询服务;辅助决策措施包括固化指标数据预警、个案流调率异常预警、PITC信息异常预警、治疗转介信息异常预警、治疗提醒、随访提醒、配偶阳转提醒、死亡提醒、羁押释放提醒等指标预警和消息推送;决策树具体为单模型数据或多模型数据之间的决策树。

步骤二应用统计学中的描述统计,计算出相应指标的具体步骤如下:

(1)均值计算:通过均值计算,统计出不同的分类指标,其中,均值计算公式如下:

由此得出:在当前环境下,各分类指标的观测值相对集中较多的中心位置,以此

(2)方差和标准差计算:基于(1)中的均值公式,计算方差,统计指标数据的偏离程度,其中方差和标准差计算公式如下:

方差:

标准差:

由此得出:方差s2越小,表示指标数据偏离程度越小;表明该地区的CD4监测率波动较大,分析原因,可能为HIV传播率较大;同时利用计算的方差求出标准差,以标准差决定直方图、折线图的坐标区间,使数据展示图更为清晰;

(3)众数查找:是指在统计分布上具有明显集中趋势点的数值,即出现次数最多的值;该方法使用二叉搜索树算法,找出出现频率最高的数据,步骤如下:

①遍历二叉树,用哈希表来计数;

②进行中序遍历后的序列是有序序列,在中序遍历时求众数;

(4)最大值和最小值查找:

通过顺序查找算法,查找出不同地区或不同时段内的最大值和最小值,分析在区域或时段维度的工作情况指标数据。

特征分类集合包括将个案流调形成确诊、感染、正常的诊断信息特征分类集合、划分个案流调率区间,根据不同区间值形成个案流调率特征分类集合、按转介信息形成转介、脱失、入组人员信息及脱失、未转介、未入组的特征分类集合以及根据ART进展情况形成治疗与未治疗的特征分类集合。

决策树算法思路如下:

S1:从根节点开始,按照训练数据的每个特征进行计算,根据每个特征的不确定性将训练数据分配到其子节点(分支),沿着该分支可能达到叶子节点或者到达另一个内部节点;

S2:对剩余的特征递归执行下去,直到抵达一个叶子节点;当都到达叶子节点时,即得到决策树。

决策树中利用类别熵(H(c))以及特征条件熵(H(c|x)),同时在此基础上计算信息增益(G(x)),在建立决策树的过程中,一个特征的信息增益越大,表明特征对样本的熵减少的能力越强,这个特征使得数据由不确定性变成确定性的能力越强;在多个类别的情况下,比较不同类别的信息增益,取信息增益值最大的类别作为根节点进行分裂,生成决策树;其公式如下:

G(x)=H(c)-H(c|x) (2)。

决策树的生成包括以下步骤:

SS1:特征选择:特征选择是指从训练数据的特征中选择一个特征作为当前节点的分裂点;

SS2:训练数据集:该数据集是不同特征分类集合中的某一个特征与另一个或多个特征分类集合其中一个特征所形成的集合,其中,所形成的每条数据集都对应一个决策依据,形成的决策依据用于对病人和医务人员进行未治疗提醒;根据训练的样本数据集形成的决策依据,用于为决策树的学习提供模板;

SS3:生成决策树:根据选择的特征评估标准,从上至下递归地生成子节点,将进一步进行决策树的完善,用同样的方式,针对剩余的三个纬度进行计算,直到数据集不可分则停止决策树生长。

分裂点包括ART进展情况形成治疗和未治疗的特征分类集合;决策依据包括PITC诊断信息特征分类集合中的确诊特征+转介信息特征集合中的入组特征+ART进展特征中的未治疗。

工作原理:对于这类的基于多数据分析模型的艾滋病防治决策方法,第一步,建立基础数据收集模型,并利用基础数据收集模型对艾滋病病人基础数据进行收集;第二步,对收集到的基础数据应用描述统计的计算方法进行多种数据分析统计模型的构建,具体包括个案流调数据统计分析模型、PITC信息统计分析模型、治疗转介信息统计分析模型和三类人群ART进展数据统计分析模型,得到描述性图表,其描述性图表包括艾滋病感染者和病人所包含的CD4检测、个案流调、治疗转介、抗病毒治疗及PITC艾滋病检测咨询服务特征信息;第三步,对第二步中的描述性图表进行监控,选择描述性图表中所包含不同类别的属性的特征信息,形成特征分类集合;第四步,采用决策树算法对特征分类集合进行决策树构建,并根据选择的特征评估标准,从上至下递归地生成子节点,直到数据集不可分则停止决策树停止生长,得到辅助决策措施,其中辅助决策措施,包括固化指标数据预警、个案流调率异常预警、PITC信息异常预警、治疗转介信息异常预警,治疗提醒、随访提醒、配偶阳转提醒,死亡提醒,羁押释放提醒等指标预警和消息推送;本发明通过已有的特征分类集合,根据固化指标数据预警、个案流调率异常预警、PITC信息异常预警、治疗转介信息异常预警,治疗提醒、随访提醒、配偶阳转提醒,死亡提醒,羁押释放提醒等指标预警和消息推送等不同的决策依据和特征评估标准,提取样本数据,训练数据集,构建出不同的决策树,以决策树生成的决策依据,为责任人提供了数据分析服务,为艾滋病防治工作提供辅助决策的依据,同时对艾滋病防治工作进行有针对性的跟进,有的放矢,更好的实现艾滋病防治的目标。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号