首页> 中国专利> 一种基于医疗大数据、依据社会属性构建疾病画像的方法

一种基于医疗大数据、依据社会属性构建疾病画像的方法

摘要

本发明公开了一种基于医疗大数据、依据社会属性构建疾病画像的方法,包括步骤:S1,将用户画像数据映射为树形结构疾病社会属性画像;S2,先纵向进行候选疾病的指向性链式挖掘,然后横向挖掘形成指向性属性关系图谱等;本发明方便专业医疗人员对疾病(甚至未知的)从社会角度进行更全面立体的分析,进而推理出疾病的社会成因以及一些未知特性,可以作为目前医疗大数据应用的一种补充等。

著录项

  • 公开/公告号CN113284629A

    专利类型发明专利

  • 公开/公告日2021-08-20

    原文格式PDF

  • 申请/专利权人 成都索贝数码科技股份有限公司;

    申请/专利号CN202110803489.6

  • 发明设计人 肖睿;温序铭;潘运刚;

    申请日2021-07-16

  • 分类号G16H50/70(20180101);G16H50/30(20180101);G16H10/60(20180101);G06F16/31(20190101);G06F16/36(20190101);

  • 代理机构51214 成都九鼎天元知识产权代理有限公司;

  • 代理人贾年龙

  • 地址 610041 四川省成都市高新区新园南二路2号

  • 入库时间 2023-06-19 12:16:29

说明书

技术领域

本发明涉及医疗大数据应用技术领域,更为具体的,涉及一种基于医疗大数据、依据社会属性构建疾病画像的方法。

背景技术

目前的医疗类知识图谱多为表现症状与疾病间的静态关系,以疾病诊断为目的,而忽略了疾病与社会属性(本发明设定非专业医学领域的属性为社会属性,如性别、职业、气候、活动区域等)之间的动态关系,难以以社会现象为基础发现潜在的疾病问题并提前采取举措进行抑制,也无法有效探寻疾病的社会成因。

而业内主流的以患者为主体的用户画像虽然记录了社会属性,但只能用于发现和预警相关用户的个体疾病风险,不能直接应用到面向社会范围内疾病风险问题的防控上。

发明内容

本发明的目的在于克服现有技术的不足,提供一种基于医疗大数据、依据社会属性构建疾病画像的方法,方便专业医疗人员对疾病(甚至未知的)从社会角度进行更全面立体的分析,进而推理出疾病的社会成因以及一些未知特性,可以作为目前医疗大数据应用的一种补充等。

本发明的目的是通过以下方案实现的:

一种基于医疗大数据、依据社会属性构建疾病画像的方法,包括步骤:

S1,将用户画像数据映射为树形结构疾病社会属性画像;

S2,先纵向进行候选疾病的指向性链式挖掘,然后横向挖掘形成指向性属性关系图谱。

进一步地,在步骤S1中,包括步骤:

S11,将用户画像数据库中选定时间片段内所患各类疾病的数量进行统计,然后按指定过滤值进行过滤,大于指定过滤值则进入候选疾病;

S12,以步骤S11中候选疾病为关键词,检索出每条包含该候选疾病的用户画像数据,然后对这些用户画像数据的社会属性进行统计,以疾病为根节点构建树形结构疾病社会属性画像。

进一步地,在步骤S2中,包括步骤:

S21,以建立了树形结构疾病社会属性画像的疾病的指向性属性为检索关键词,检索出每条包含该指向性属性的用户画像数据,然后对这些用户画像数据的指向性属性进行统计,构建以指向性属性为根节点的指向性属性画像;

S22,分析指向性属性画像下的各类疾病,若存在指向性疾病,则在步骤S21中树形结构疾病社会属性画像的此指向性属性节点下生成一个节点,并把该节点标识为此指向性属性的辅助节点,然后以此辅助节点为起点逆向生成指向性疾病的画像;

S23,以步骤S22中生成的指向性疾病的画像为基础重复步骤S21、S22,直到挖掘到的疾病没有任何指向性属性,或达到预先指定的挖掘深度,每一次挖掘的检索过程排除使用过的社会属性和疾病;

S24,检索步骤S11确定的候选疾病的树形结构疾病社会属性是否具备共同的指向性属性,有则合并此指向性属性的辅助节点,从而形成包含各个树形结构疾病社会属性画像间指向性属性关系的宏观组织图谱。

进一步地,包括如下更新步骤S3:根据对树形结构疾病社会属性画像生成间隔的粒度需求选定一个时间单位作为时间片段,每过一个时间片段生成该时间片段的树形结构疾病社会属性画像,并记录各个时间片段的树形结构疾病社会属性画像,形成包含时间维度的用户疾病画像;推移时间片段,每次推移时间片段时都设置一个反馈机制,该反馈机制用于完善推移后的时间片段的更新过程。

进一步地,在步骤S3中,包括步骤:

S31,在时间片段推移前,保存上一个即推移前的时间片段内所有树形结构疾病社会属性画像的根节点数据,记录疾病名和疾病数量这一对键值,将这些保存和记录的数据作为优化下次画像更新过程的数据基础;

S32,在时间片段推移后,步骤S1中获得树形结构疾病社会属性画像后,将对应疾病的根节点与步骤S31对应留存的根节点进行数据比对,并在树形结构疾病社会属性画像的根节点下增加一个状态属性节点,该状态属性节点的值为留存根节点值与当前根节点值的差;若疾病有留存根结点但在当前时间片段消失即未入候选疾病,则在当前时间片段增加这个疾病的树形结构疾病社会属性画像,再增加其状态属性节点,若疾病存在于当前时间片段但没有留存根结点,则不为其树形结构疾病社会属性画像增加状态属性节点。

进一步地,在该步骤S11中,还能够由专业医疗从业者根据经验指定需要观察的疾病加入候选疾病

进一步地,在步骤S11中,统计的疾病种类与采用的用户画像中记录的种类一致。

进一步地,在步骤S12中,根节点以外的节点称为属性节点,每个节点都包含一个键-值对,键表示构建该节点依据的社会属性,称为属性名,值表示该社会属性统计后的数量,即该社会属性下患者的数量,称为属性值明确指定其键,属性节点由用户画像的社会属性决定。

本发明的有益效果包括:

本发明提供了构建一种随着时间推移动态更新、表达疾病与社会属性之间关系的疾病画像,区别于主流的医学属性知识图谱和用户画像,方便专业医疗人员对疾病(甚至未知的)从社会角度进行更全面立体的分析,进而推理出疾病的社会成因以及一些未知特性,可以作为目前医疗大数据应用的一种补充。

本发明的方法周期性对用户画像数据进行深度挖掘生成实时疾病画像,以便提前在社会范围发现疾病风险,及时进行防控工作,及后续分析研究疾病的社会成因。

本发明的方法在构建画像伊始,通过过滤统计到的疾病得到候选疾病用以建立疾病画像,即这种疾病画像相对一般疾病具备更大的可挖掘信息,而不是为所有记录的疾病建立画像,造成数据臃肿。

本发明的方法在完善疾病画像的环节,纵向采用指向性链式挖掘方法,横向进行广度关联,获取疾病间潜在的社会属性关联,形成以指向性属性辅助节点为关联点的画像关系图谱。基于图谱即可从疾病出发,正向分析疾病画像的属性,亦可直接检索指向性属性辅助节点获取关键社会属性,逆向分析追查关联疾病。

本发明的方法提出了一种基于留存疾病根结点的动态反馈机制用于完善疾病的分析过程,在过滤掉骤降的疾病后进行补救,一定程度上保证了具有潜在分析价值的疾病的留存。

本发明的方法在现有表现症状与疾病间的静态关系的主流医疗类知识图谱基础上增加了一种动态疾病画像用于分析疾病的社会成因,扩展了医疗类知识图谱的边界,且辅助医疗从业者在社会范围及时发现疾病风险。

本发明的方法以现有的基于用户的画像数据为基础,以疾病为刻画对象,逆向构建出疾病画像,对原本的数据进行了高阶的数据挖掘,增加了用户画像的数据价值。

本发明的方法采用动态反馈机制和指向性链式挖掘处理过程,进一步完善疾病画像数据,查缺补漏,提升了画像本体的数据完整性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例中基于时间片段的疾病画像更新示意图;

图2为本发明实施例中疾病基础画像构建示意图;

图3为本发明实施例中树结构的疾病画像实例示意图;

图4为本发明实施例中疾病的指向性属性画像构建示意图;

图5为本发明实施例中纵向指向性链式挖掘和横向广度挖掘的示意图。

具体实施方式

本说明书中所有实施例公开的所有特征,或隐含公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合和/或扩展、替换。

本发明中设定非专业医学领域的属性为社会属性,结构化的用户画像先天包含了各种社会属性数据,如用户的性别、职业、年龄、所在区域等,是构建疾病社会属性画像的良好数据基础。本发明专注于疾病画像(数据结构)的构建过车,不涉及具体的疾病画像分析应用方法。

如图1~图5所示,一种基于医疗大数据、依据社会属性构建疾病画像的方法,包括步骤:

S1,将用户画像数据映射为树形结构疾病社会属性画像;

S2,先纵向进行候选疾病的指向性链式挖掘,然后横向挖掘形成指向性属性关系图谱。

在可选的实施方式中,在步骤S1中,包括步骤:

S11,将用户画像数据库中选定时间片段内所患各类疾病的数量进行统计,然后按指定过滤值进行过滤,大于指定过滤值则进入候选疾病;在该步骤中,过滤值可由专业医疗人员凭借经验人工指定,亦可通过数学计算得到,如计算所有疾病数量的均值,大于均值则进入候选。统计的疾病种类与采用的用户画像中记录的种类一致,可对总种类进行人工划分,分类进行画像构建等。

S12,以步骤S11中候选疾病为关键词,检索出每条包含该候选疾病的用户画像数据,然后对这些用户画像数据的社会属性进行统计,以疾病为根节点构建树形结构疾病社会属性画像。根节点以外的节点称为属性节点,每个节点都包含一个键-值对,键表示构建该节点依据的社会属性,称为属性名,值表示该社会属性统计后的数量,即该社会属性下患者的数量,称为属性值明确指定其键。属性节点由用户画像的社会属性决定,以2层树结构为例,可选年龄段、区域、职业等基础社会属性构成第一层的各个属性节点。最终的叶子属性节点为每个社会属性的具体分类,年龄属性节点的子节点可为:幼年、青年、中年、老年,区域属性节点的子节点可为:A区、B区、C区、D区等,职业属性节点的子节点可为:教师、工人、学生、医护人员等,如图3所示是一个疾病画像树形结构实例。如果用户画像数据的社会属性支持更深层次的分类,如学生分成小学生、中学生、大学生等,则这些属性节点可继续向下生成子节点等。

在可选的实施方式中,在步骤S2中,包括步骤:

S21,以建立了树形结构疾病社会属性画像的疾病的指向性属性为检索关键词,检索出每条包含该指向性属性的用户画像数据,然后对这些用户画像数据的指向性属性进行统计,构建以指向性属性为根节点的指向性属性画像;在该步骤中,指向性属性指属性值相对于同一父节点下的其它属性值有明显区别的属性,如定义为极大值、极小值或定义属性值高于均值则属于指向性属性等,这里不对明显区别做具体量化。指向性属性画像只包含疾病这类属性,可具体称为指向性属性的疾病属性画像。

S22,分析指向性属性画像下的各类疾病,若存在指向性疾病,则在步骤S21中树形结构疾病社会属性画像的此指向性属性节点下生成一个节点,并把该节点标识为此指向性属性的辅助节点,然后以此辅助节点为起点逆向生成指向性疾病的画像;在该步骤中,指向性疾病为指向性属性具体为疾病时的结果,即其患者值能明显区别于其它疾病的患者值。指向性属性的辅助节点只包含节点的属性名,即键,区别于画像树的节点。

S23,以步骤S22中生成的指向性疾病的画像为基础重复步骤S21、S22,直到挖掘到的疾病没有任何指向性属性,或达到预先指定的挖掘深度,每一次挖掘的检索过程排除使用过的社会属性和疾病;在该步骤中,挖掘深度的单位可定义为1次构建疾病画像和它的指向性属性画像的流程,即图1和图3所示流程,每执行1次该流程,挖掘深度加1,挖掘深度的初始值为1,即至少进行一次纵向指向性链式挖掘。

S24,检索步骤S11确定的候选疾病的树形结构疾病社会属性是否具备共同的指向性属性,有则合并此指向性属性的辅助节点,从而形成包含各个树形结构疾病社会属性画像间指向性属性关系的宏观组织图谱。该图谱实质是通过各个指向性属性的辅助节点关联起来的疾病画像集合。

在可选的实施方式中,包括如下更新步骤S3:根据对树形结构疾病社会属性画像生成间隔的粒度需求选定一个时间单位作为时间片段,每过一个时间片段生成该时间片段的树形结构疾病社会属性画像,并记录各个时间片段的树形结构疾病社会属性画像,形成包含时间维度的用户疾病画像;推移时间片段,每次推移时间片段时都设置一个反馈机制,该反馈机制用于完善推移后的时间片段的更新过程。

在可选的实施方式中,在步骤S3中,包括步骤:

S31,在时间片段推移前,保存上一个即推移前的时间片段内所有树形结构疾病社会属性画像的根节点数据,记录疾病名和疾病数量这一对键值,将这些保存和记录的数据作为优化下次画像更新过程的数据基础;

S32,在时间片段推移后,步骤S1中获得树形结构疾病社会属性画像后,将对应疾病的根节点与步骤S31对应留存的根节点进行数据比对,并在树形结构疾病社会属性画像的根节点下增加一个状态属性节点,该状态属性节点的值为留存根节点值与当前根节点值的差;若疾病有留存根结点但在当前时间片段消失即未入候选疾病,则在当前时间片段增加这个疾病的树形结构疾病社会属性画像,再增加其状态属性节点,若疾病存在于当前时间片段但没有留存根结点,则不为其树形结构疾病社会属性画像增加状态属性节点。在该步骤中,为有留存根节点但当前时间片段未入候选的疾病增加画像的目的在于考虑到疾病数量骤降后有概率会被步骤S1过滤掉,而疾病数量骤降也具有潜在分析价值,因此增加了这个反馈机制防止潜在含重要信息的疾病画像丢失。

在可选的实施方式中,在步骤S11中,还能够由专业医疗从业者根据经验指定需要观察的疾病加入候选疾病。

在可选的实施方式中,在步骤S11中,统计的疾病种类与采用的用户画像中记录的种类一致。

在可选的实施方式中,在步骤S12中,根节点以外的节点称为属性节点,每个节点都包含一个键-值对,键表示构建该节点依据的社会属性,称为属性名,值表示该社会属性统计后的数量,即该社会属性下患者的数量,称为属性值明确指定其键,属性节点由用户画像的社会属性决定。

本发明未涉及部分均与现有技术相同或可采用现有技术加以实现。

上述技术方案只是本发明的一种实施方式,对于本领域内的技术人员而言,在本发明公开了应用方法和原理的基础上,很容易做出各种类型的改进或变形,而不仅限于本发明上述具体实施方式所描述的方法,因此前面描述的方式只是优选的,而并不具有限制性的意义。

除以上实例以外,本领域技术人员根据上述公开内容获得启示或利用相关领域的知识或技术进行改动获得其他实施例,各个实施例的特征可以互换或替换,本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

本发明功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,在一台计算机设备(可以是个人计算机,服务器,或者网络设备等)以及相应的软件中执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、或者光盘等各种可以存储程序代码的介质,进行测试或者实际的数据在程序实现中存在于只读存储器(Random Access Memory,RAM)、随机存取存储器(Random Access Memory,RAM)等。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号