首页> 中国专利> 健康意识参数的检测方法、装置、电子设备和存储介质

健康意识参数的检测方法、装置、电子设备和存储介质

摘要

本申请提出一种健康意识参数的检测方法、装置、电子设备和存储介质,其中,方法包括:获取知识图谱;其中,知识图谱中各节点具有关联的测试题目;从知识图谱各节点关联的测试题目中抽取出至少一个目标题目;获取第一用户对各目标题目作答的正确概率;根据各目标题目的正确概率,以及各目标题目设定的可猜测性,确定第一用户的健康意识参数。由此,能够实现无需离线对用户的健康意识参数进行检测,可以降低检测成本,并提升检测的覆盖面。并且,根据各目标题目的正确概率,以及各目标题目设定的可猜测性,确定用户的健康意识参数,相较于现有技术中直接使用调查问卷得分来表征用户的健康意识参数的方式,可以提升检测结果的合理性和可靠性。

著录项

  • 公开/公告号CN112786202A

    专利类型发明专利

  • 公开/公告日2021-05-11

    原文格式PDF

  • 申请/专利权人 安徽华米健康科技有限公司;

    申请/专利号CN202110113786.8

  • 发明设计人 李佳;朱国康;

    申请日2021-01-27

  • 分类号G16H50/30(20180101);G16H10/20(20180101);G06F16/36(20190101);G06N3/08(20060101);G06F17/11(20060101);G06F17/18(20060101);

  • 代理机构11201 北京清亦华知识产权代理事务所(普通合伙);

  • 代理人韩海花

  • 地址 230051 安徽省合肥市高新区望江西路900号中安创谷科技园B2栋5层01号

  • 入库时间 2023-06-19 10:55:46

说明书

技术领域

本申请涉及深度学习技术领域,尤其涉及一种健康意识参数的检测方法、装置、电子设备和存储介质。

背景技术

随着经济和社会的快速发展,人们的生活水平逐步提高,不论是个人还是社会,对于健康的认知不断地深化。健康认知从只要身体未出现疾病就是健康,改变为关注疾病的预防,而良好的健康意识在疾病预防过程中起到了不可替代的作用,相应地,对于健康意识评估的需求日益强烈。其中,健康意识评估用于客观评价被测人员对自身健康状况的重视程度,能够反映个体层面的健康综合认知。虽然健康意识不等同于健康状况,但是由于健康意识往往与健康行为具有较强的关联性,健康意识高的人更容易保持良好的生活习惯,从而拥有良好的健康状况。

相关技术中,健康意识评估系统主要以离线评估为主,通常采用调查问卷或专业人士询问的方式进行。而在线健康意识评估系统的案例较少,比较典型的是Health IQ公司的健康智商测试,使用在线填写问卷的方式为用户测评健康意识,同时为了防止作弊,在线问卷通常具有个性化的特点,不同用户的问卷试题不完全相同。借助于互联网的便利性和计算机的高效性,在线填写调查问卷可以方便的应用于大规模人群,并且在较短时间内得到问卷的批阅结果。

然而,离线健康意识评估系统需招募受测人员,成本较高,只能应用于极小规模的人群,填写后的调查问卷需要专业人士批阅,导致调查问卷只能包含少量的健康知识问题,覆盖面不足,无法准确评价用户的健康意识状况。而在线健康意识评估系统的调查问卷具有个性化的特点,不同的用户面对的调查问卷中测试题目不同,仅按照问卷分数来比较不同用户的健康意识显然是不合理的。

发明内容

本申请旨在至少在一定程度上解决相关技术中的技术问题之一。

本申请提出一种健康意识参数的检测方法、装置、电子设备和存储介质,以实现无需离线对用户的健康意识参数进行检测,从而无需招募受测人员,可以降低检测成本,并提升检测的覆盖面。并且,根据各目标题目的正确概率,以及各目标题目设定的可猜测性,确定用户的健康意识参数,相较于现有技术中直接使用调查问卷得分来表征用户的健康意识参数的方式,可以提升检测结果的合理性和可靠性。

本申请第一方面实施例提出了一种健康意识参数的检测方法,包括:

获取知识图谱;其中,所述知识图谱中各节点具有关联的测试题目;

从所述知识图谱各节点关联的测试题目中抽取出至少一个目标题目;

获取第一用户对各所述目标题目作答的正确概率;

根据各所述目标题目的正确概率,以及各所述目标题目设定的可猜测性,确定所述第一用户的健康意识参数;其中,所述可猜测性,是根据所述目标题目的选项的个数和题目类型确定的,用于指示随机选出的选项是所述目标题目的标准答案的概率。

本申请实施例的健康意识参数的检测方法,通过获取知识图谱;其中,知识图谱中各节点具有关联的测试题目;从知识图谱各节点关联的测试题目中抽取出至少一个目标题目;获取第一用户对各目标题目作答的正确概率;根据各目标题目的正确概率,以及各目标题目设定的可猜测性,确定第一用户的健康意识参数。由此,无需离线对用户的健康意识参数进行检测,从而无需招募受测人员,可以降低检测成本,并提升检测的覆盖面。并且,根据各目标题目的正确概率,以及各目标题目设定的可猜测性,确定用户的健康意识参数,相较于现有技术中直接使用调查问卷得分来表征用户的健康意识参数的方式,可以提升检测结果的合理性和可靠性。

为达上述目的,本申请第二方面实施例提出了一种健康意识参数的检测装置,包括:

图谱获取模块,用于获取知识图谱;其中,所述知识图谱中各节点具有关联的测试题目;

抽取模块,用于从所述知识图谱各节点关联的测试题目中抽取出至少一个目标题目;

概率获取模块,用于获取第一用户对各所述目标题目作答的正确概率;

确定模块,用于根据各所述目标题目的正确概率,以及各所述目标题目设定的可猜测性,确定所述第一用户的健康意识参数;其中,所述可猜测性,是根据所述目标题目的选项的个数和题目类型确定的,用于指示随机选出的选项是所述目标题目的标准答案的概率。

本申请实施例的健康意识参数的检测装置,通过获取知识图谱;其中,知识图谱中各节点具有关联的测试题目;从知识图谱各节点关联的测试题目中抽取出至少一个目标题目;获取第一用户对各目标题目作答的正确概率;根据各目标题目的正确概率,以及各目标题目设定的可猜测性,确定第一用户的健康意识参数。由此,无需离线对用户的健康意识参数进行检测,从而无需招募受测人员,可以降低检测成本,并提升检测的覆盖面。并且,根据各目标题目的正确概率,以及各目标题目设定的可猜测性,确定用户的健康意识参数,相较于现有技术中直接使用调查问卷得分来表征用户的健康意识参数的方式,可以提升检测结果的合理性和可靠性。

为达上述目的,本申请第三方面实施例提出了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如本申请第一方面实施例提出的健康意识参数的检测方法。

为了实现上述目的,本申请第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请第一方面实施例提出的健康意识参数的检测方法。

为了实现上述目的,本申请第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行如本申请第一方面实施例提出的健康意识参数的检测方法。

本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:

图1为本申请实施例一所提供的健康意识参数的检测方法的流程示意图;

图2为本申请实施例中运动知识体系对应的知识图谱示意图;

图3为本申请实施例二所提供的健康意识参数的检测方法的流程示意图;

图4为本申请实施例三所提供的健康意识参数的检测方法的流程示意图;

图5为本申请中第二用户对“篮球”节点关联的网络资源的访问数据示意图;

图6为本申请实施例四所提供的健康意识参数的检测方法的流程示意图;

图7为本申请实施例中基于访问行为评估健康意识参数的流程示意图;

图8为本申请实施例五所提供的健康意识参数的检测装置的结构示意图;

图9示出了适于用来实现本申请实施方式的示例性电子设备的框图。

具体实施方式

下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。

下面参考附图描述本申请实施例的健康意识参数的检测方法、装置、电子设备和存储介质。

图1为本申请实施例一所提供的健康意识参数的检测方法的流程示意图。

本申请实施例中,该健康意识参数的检测方法,可以应用于在线健康意识评估系统。

如图1所示,该健康意识参数的检测方法可以包括以下步骤:

步骤101,获取知识图谱;其中,知识图谱中各节点具有关联的测试题目。

其中,知识图谱(Knowledge Graph)的概念最早起源于互联网搜索引擎领域,知识图谱由相互连接的节点和边组成,节点表示概念,边表示概念之间的关系。

应当理解的是,不同的领域可以对应不同的知识体系,而不同的知识体系对应不同的知识图谱,因此,针对不同的领域,可以创建不同的知识图谱,而本申请主要涉及健康领域,因此,本申请中,可以预先基于健康领域的知识体系,创建健康领域的知识图谱。

例如,在创建健康领域的知识图谱时,可以依托慢病学、流行病学、心理学、运动教育学、营养学领域专业人士,将健康领域内的基本概念进行整理汇总,涵盖慢性病、急性病、心理疾病、家庭用药、科学睡眠、运动、饮食营养七个类别的基本概念,并为每个叶子级基本概念(最基本的基本概念)关联相应的网络资源,包括视频、文章和测试题目,其中,视频内容可以包含网络公开课、教程、专家直播课等,文章内容可以包含科普、新闻和自媒体文章,测试题目可以由健康领域专业人士创建。从而可以将每个基本概念看作一个知识点,梳理七个类别知识点之间的关系,可以得到健康领域的知识图谱。举例而言,如果知识点A从属于知识点B,比如“自行车运动”属于“运动类型”,则将两个知识点连接起来,并且标明二者的从属关系,按照这种方式对七个类别知识点之间的关系进行梳理后,可以得到健康领域的知识图谱。

作为一种示例,以健康领域的运动知识体系进行示例,梳理得到的知识图谱可以如图2所示。

本申请实施例中,在对用户进行健康意识参数评估时,例如,用户使用健康意识评估系统在线填写调查问卷时,该健康意识评估系统可以获取已建立的知识图谱。

步骤102,从知识图谱各节点关联的测试题目中抽取出至少一个目标题目。

本申请实施例中,知识图谱中每个节点可以包含多道测试题目,各节点关联的多道测试题目可由健康领域专业人士创建。其中,测试题目的类型可以为单项选择题,或者,也可以为多项选择题,本申请对此并不做限制。

作为一种示例,测试题目可以为:

以下运动方式属于无氧运动的是?

(a)慢跑;

(b)慢速游泳;

(c)短跑;

(d)慢速骑行;

以下食物中相同重量(100g)热量最高的是?

(a)苹果;

(b)香蕉;

(c)黄瓜;

(d)瓜子仁;

需要说明的是,上述仅以测试题目为单项选择题,且每道测试题目的选项为四个进行示例,实际应用时,单项选择题的选项还可以为2个、3个、5个等等,和/或,测试题目也可以为多项选择题,本申请对此并不作限制。其中,每道测试题目的选项个数可以相同,或者也可以不同,上述仅以每道测试题目的选项个数相同,为四个进行示例。

本申请实施例中,对用户进行健康意识参数评估时,可以从知识图谱各节点关联的测试题目中抽取出至少一个目标题目,以形成调查问卷。其中,目标题目是指在线健康意识评估系统所抽取出的测试题目。

应当理解的是,若每个用户在进行健康意识参数评估时,调查问卷中的测试题目相同,则可能出现作弊的情况,比如,先填写调查问卷的用户可能会泄露测试题目,后填写调查问卷的用户可以去互联网上搜索相同测试题目的答案。并且,同一个用户可能多次进行健康意识参数评估,若每次填写的调查问卷相同,则该用户可能会失去作答的兴趣。

因此,作为本申请实施例的一种可能的实现方式,为了防止用户作弊,以及调动用户填写调查问卷的积极性,可以从知识图谱各节点关联的测试题目中随机抽取出至少一个目标题目。

举例而言,知识图谱的根节点可以具有七个子节点,分别为慢性病、急性病、心理疾病、家庭用药、科学睡眠、运动、饮食营养,可以分别从慢性病、急性病、心理疾病、家庭用药、科学睡眠、运动、饮食营养对应的子节点中,随机选择5个节点,并从选取的各节点所关联的测试题目中随机抽取一道测试题目,作为目标题目,生成一份包含7*5=35道目标题目的个性化调查问卷。

步骤103,获取第一用户对各目标题目作答的正确概率。

本申请实施例中,第一用户为使用健康意识评估系统在线填写调查问卷的用户,即第一用户为参与调查问卷答题的用户。

本申请实施例中,每道目标题目的正确概率是根据第一用户针对该目标题目的作答情况确定的。

本申请实施例中,第一用户在完成调查问卷作答后,针对调查问卷中的每一道目标题目,可以提取该目标题目的索引号,和第一用户针对该目标题目的作答情况,本申请中记为第一用户作出的实际答案,根据该目标题目的索引号去知识图谱中检索该目标题目的标准答案,将该目标题目的标准答案和第一用户作出的实际答案进行比较,根据比较结果,确定第一用户对该目标题目作答的正确概率。例如,如果根据比较结果确定实际答案与标准答案一致,则判断第一用户回答正确,如果根据比较结果确定实际答案与标准答案不一致,则判断第一用户回答错误。针对每一道目标试题,当第一用户回答正确时,该目标题目作答的正确概率可以为1,而当第一用户回答错误时,该目标题目作答的正确概率可以为0。

步骤104,根据各目标题目的正确概率,以及各目标题目设定的可猜测性,确定第一用户的健康意识参数。

其中,可猜测性,是根据目标题目的选项的个数和题目类型确定的,用于指示随机选出的选项是目标题目的标准答案的概率。

本申请实施例中,每道测试题目的可猜测性与该测试题目的选项个数和测试题目的题目类型相关,其中,题目类型例如可以为单项选择题(简称单选)、多项选择题(简称多选)。可以理解的是,当健康领域专业人士创建每道测试题目后,该测试题目的标准答案是可知的,因而,该测试题目的可猜测性是可以计算得到的。举例而言,当测试题目的类型为单项选择题,且测试题目的选项个数为N个时,该测试题目的可猜测性为1/N,比如N=4时,测试题目的可猜测性为0.25。再例如,当测试题目的类型为多项选择题,比如为N选(N-2)时,测试题目的可猜测性为

因此,本申请中,针对每道测试题目,可以预先设定该测试题目的可猜测性。其中,不同测试题目对应的可猜测性可以相同,或者,也可以不同。

需要说明的是,不同调查问卷中的目标题目可以不同,而不同的目标题目对应的可猜测性可以相同,或者也可以不同,为了提升健康意识参数确定结果的准确性,可以根据各目标题目的正确概率,以及各目标题目设定的可猜测性,确定第一用户的健康意识参数。相较于现有技术中直接使用调查问卷得分来表征被测人员的健康意识参数,根据各目标题目的正确概率,以及各目标题目设定的可猜测性,确定第一用户的健康意识参数,可以提升健康意识参数评估结果的合理性和可靠性。

本申请实施例的健康意识参数的检测方法,通过获取知识图谱;其中,知识图谱中各节点具有关联的测试题目;从知识图谱各节点关联的测试题目中抽取出至少一个目标题目;获取第一用户对各目标题目作答的正确概率;根据各目标题目的正确概率,以及各目标题目设定的可猜测性,确定第一用户的健康意识参数。由此,无需离线对用户的健康意识参数进行检测,从而无需招募受测人员,可以降低检测成本,并提升检测的覆盖面。并且,根据各目标题目的正确概率,以及各目标题目设定的可猜测性,确定用户的健康意识参数,相较于现有技术中直接使用调查问卷得分来表征用户的健康意识参数的方式,可以提升检测结果的合理性和可靠性。

在本申请实施例的一种可能的实现方式中,针对每一道目标题目,可以将该目标题目的正确概率以及该目标题目的可猜测性,带入预测公式中,得到包含健康意识参数的预测方程,而后,可以对各目标题目的预测方程,采用最大似然估计算法求解,得到健康意识参数。下面结合实施例二,对上述过程进行详细说明。

图3为本申请实施例二所提供的健康意识参数的检测方法的流程示意图。

如图3所示,在图1所示实施例的基础上,步骤104具体可以包括以下步骤:

步骤201,对每一目标题目,将目标题目的正确概率,以及目标题目的可猜测性,代入预测公式中,得到包含未知参数的预测方程;其中,未知参数包括健康意识参数。

本申请实施例中,每道目标题目的可猜测性是设定的。每道目标题目的正确概率是根据第一用户针对该目标题目的作答情况确定的。

本申请实施例中,可以根据预测公式,计算记得到第一用户的健康意识参数。具体地,针对每一道目标题目,可以分别将该目标题目的正确概率,以及目标题目的可猜测性,代入预测公式中,得到包含未知参数的预测方程,即每一道目标题目,均有对应的预测方程。其中,未知参数可以包括健康意识参数。

在本申请实施例的一种可能的实现方式中,可以使用认知诊断领域中的项目反应理论(Item Response Theory,简称IRT)来评估第一用户的健康意识参数。其中,项目反应理论模型中的“项目”是指调查问卷中的目标题目,“项目反映”指的是被测人员,即第一用户对调查问卷中目标题目的作答情况。

IRT模型可以假设待测人员,即第一用户对目标题目的作答结果受四方面的影响:第一用户的能力水平、目标题目的难度、目标题目的区分度、目标题目的可猜测性,其中,第一用户的能力水平由健康意识参数表征。分别用θ、a、b、c表示第一用户的健康意识参数、目标题目的难度、目标题目的区分度、目标题目的可猜测性,则针对每道目标题目,该目标题目的正确概率P(θ)可以根据公式(1)确定:

即预测公式可为公式(1),未知参数可以包括健康意识参数、每道目标题目的难度和区分度。

举例而言,假设测试题目的类型为单项选择题,且测试题目的选项个数为4个,则c=0.25,针对第一道目标题目,假设用户回答正确,此时,可以得到第一道题目的预测方程为

针对第二道目标题目,假设用户回答错误,此时,可以得到第一道题目的预测方程为

依次类推,可以得到每一道目标题目对应的预测方程。

步骤202,对各目标题目的预测方程,采用最大似然估计算法求解,得到健康意识参数。

例如,可以采用最大似然估计(Maximum Likelihood Estimation,简称MLE)算法求解,确定IRT模型中的未知参数θ、a和b,从而可以得到第一用户的健康意识参数θ。

具体地,对于第一用户而言,对于不同的目标题目而言,该第一用户的健康意识参数θ为定值,而a和b与各道目标题目相关,当目标题目不同时,a和b的取值可以不同。仍以步骤201中的例子示例,针对第一道目标题目,该目标题目的难度为a1、该目标题目的区分度为b1,而针对第二道目标题目,该目标题目的难度为a2、该目标题目的区分度为b2。

采用最大似然估计算法求解各参数时,可以先对θ、a1、a2、b1、b2进行随机初始化,比如将θ、a1、a2、b1、b2均初始化为0.5,则第一道和第二道目标题目的P(θ)均为0.625,而第一道目标题目实际的P(θ)为1,第二道目标题目实际的P(θ)为0,因此,优化目标可以为使得第一道目标题目的P(θ)与1之间的误差最小化,并使得第二道目标题目的P(θ)与0之间的误差最小化。可以定义一个惩罚函数,计算出此时0.625和1的差距,以及0.625和0的差距,优化目标为使得第一道目标题目的P(θ)和1之间的差距最小化,并使得第二道目标题目的P(θ)和0之间的差距最小化,此时,可以基于优化算法,比如随机梯度下降(StochasticGradient Descent,简称SGD)算法,根据计算得到的P(θ)与目标题目实际对应的P(θ)之间的差距,来调整θ、a1、a2、b1、b2的取值,然后再代入公式(1),计算得到新的P(θ),并计算新的P(θ)与目标题目实际对应的P(θ)之间的差距,然后再调整θ、a1、a2、b1、b2的值,循环往复,直到差距最小化,即可得到最优的θ、a1、a2、b1、b2的取值。

需要说明的是,现有技术中,在线健康意识评估系统完全依赖调查问卷结果,只能评估作答调查问卷的用户的健康意识参数,然而,由于很多用户并不会主动地填写调查问卷,导致该类用户无法参与评测,适用性不高。

而本申请中,针对未参与调查问卷的用户,可以根据用户的访问行为和基本信息,预测用户的健康意识参数,可以提升该方法的适用性。下面结合实施例三,对上述过程进行详细说明。

图4为本申请实施例三所提供的健康意识参数的检测方法的流程示意图。

如图4所示,该健康意识参数的检测方法可以包括以下步骤:

步骤301,获取知识图谱;其中,知识图谱中各节点具有关联的测试题目,以及关联的网络资源。

本申请实施例中,知识图谱中各节点可以具有关联的网络资源,比如视频、文章等。

步骤302,监测第二用户对网络资源的访问行为。

本申请实施例中,第二用户为未使用健康意识评估系统在线填写调查问卷的用户,即未参与调查问卷答题的用户,但浏览过知识图谱中节点关联的网络资源的用户。

本申请实施例中,用户通过互联网登录健康意识评估系统后,可以浏览知识图谱中节点关联的网络资源,例如,浏览网络资源中自身感兴趣的内容,例如浏览科普文章、新闻、自媒体文章、网络公开课、运动教程、直播课等,健康意识评估系统可以记录用户浏览的网络资源所属的多媒体资源类型(例如科普文章、新闻、网络公开课等)、网络资源包含的健康知识点、网络资源的开始浏览时间和结束浏览时间等信息,例如,访问记录可以存储在Elasticsearch数据库中。

本申请实施例中,针对未参与调查问卷答题的第二用户,可以监测该第二用户对网络资源的访问行为。其中,访问行为可以包括第二用户对各节点所关联网络资源的访问次数、访问时长(即结束浏览时间和开始浏览时间之间的时间差)等。

步骤303,对第二用户的访问行为进行特征提取,以得到第二用户的访问特征。

本申请实施例中,访问特征可以包括各知识类型的访问总次数和访问总时长;其中,每一知识类型对应知识图谱中的一个目标节点,各目标节点与知识图谱中的根节点存在直接父子关系。

举例而言,知识图谱的根节点可以具有七个目标节点,分别为慢性病、急性病、心理疾病、家庭用药、科学睡眠、运动、饮食营养,访问特征可以包括慢性病、急性病、心理疾病、家庭用药、科学睡眠、运动、饮食营养这七个节点分别对应的访问总次数和访问总时长。

其中,每一知识类型的访问总次数,是对目标节点存在直接或间接父子关系的各子节点统计关联网络资源的访问次数得到;每一知识类型的访问总时长,是对目标节点存在直接或间接父子关系的各子节点统计关联网络资源的访问时长得到。

具体地,针对每一个知识类型的访问总次数,可以确定该知识类型对应的目标节点以及该目标节点下的各子节点,可以统计该目标节点下的各子节点关联网络资源的访问次数,以得到该目标节点的访问总次数,将该目标节点的访问总次数,作为对应知识类型的访问总次数,并且,可以统计该目标节点下的各子节点关联网络资源的访问时长,以得到该目标节点的访问总时长,将该目标节点的访问总时长,作为对应知识类型的访问总时长。

举例而言,如果目标节点包含5个子节点,则可以分别统计这5个子节点对应的访问次数和访问时长,将5个子节点对应的访问次数求和,得到该目标节点的访问总次数,并将5个子节点对应的访问次数时长,得到该目标节点的访问总时长。

作为本申请实施例的一种可能的实现方式,每一网络资源可以属于一种多媒体资源类型(例如网络公开课、教程、专家直播课、科普文、新闻、自媒体文章);访问总次数可以依据各多媒体资源类型对应的权重,对各子节点关联的网络资源的访问次数加权求和得到;访问总时长可以依据各多媒体资源类型对应的权重,对各子节点关联的网络资源的访问时长加权求和得到。

具体地,每个子节点可以关联多种多媒体资源类型的网络资源,每种多媒体资源类型的网络资源的个数可以为多个,可以将子节点关联的同一种多媒体资源类型的网络资源的访问次数和访问时长分别求和,得到该子节点关联的每种多媒体资源类型的网络资源的访问次数和访问时长,而后,可以依据各多媒体资源类型对应的权重,对该子节点关联的每种多媒体资源类型的网络资源的访问次数和访问时长分别进行加权求和,得到该子节点的访问次数和访问时长。由此,可以确定每个子节点的访问次数和访问时长,将目标节点下的各子节点的访问次数求和,可以得到访问总次数,同理,将目标节点下的各子节点的访问时长求和,可以得到访问总时长。

也就是说,首先,可以确定知识图谱中没有子节点的叶子节点的访问次数和访问时长,而后,计算知识图谱中非叶子节点的访问次数和访问时长,即将该非叶子节点包含的子节点的访问次数和访问时长分别进行求和,得到该非叶子节点的访问次数和访问时长。针对每个目标节点,可以确定与该目标节点存在直接父子关系的各子节点对应的访问次数和访问时长,将与该目标节点存在直接父子关系的各子节点对应的访问次数和访问时长分别进行求和,得到该目标节点的访问总次数和访问总时长,从而可以将目标节点的访问总次数和访问总时长,作为该目标节点对应的知识类型的访问总次数和访问总时长。

举例而言,以目标节点为图2中的运动节点进行示例,可以首先计算图2中的各叶子节点对应访问次数和访问时长,例如,参见图5,图5为本申请中第二用户对“篮球”节点关联的网络资源的访问数据示意图。标记每种多媒体资源类型的网络资源的访问次数为N,每种多媒体资源类型的网络资源的访问时长(分钟)为t,则“篮球”节点的访问次数为各种多媒体资源类型的网络资源的访问次数的加权求和值,“篮球”节点的访问时长为各种多媒体资源类型的网络资源的访问时长的加权求和值。

假设多媒体资源类型包括网络公开课、教程、专家直播课、科普文、新闻、自媒体文章,分别对应的权重为0.25、0.20、0.18、0.15、0.12、0.10,则“篮球”节点的访问次数为:0.25*1+0.20*0+0.18*0+0.15*5+0.12*15+0.10*2=3.0,篮球”节点的访问时长为:0.25*30+0.20*0+0.18*0+0.15*15+0.12*34.5+0.10*0.8=13.97。

由此,可以计算所有叶子节点对应的访问次数和访问时长,针对每个非叶子节点,可以将该非叶子节点包含的各个子节点对应的访问次数和访问时长分别进行求和,得到该非叶子节点对应的访问次数和访问时长,最终可以计算得到七个目标节点(慢性病、急性病、心理疾病、家庭用药、科学睡眠、运动、饮食营养)对应的访问总次数和访问总时长。

在本申请实施例的一种可能的实现方式中,访问特征还可以包括各知识类型的访问平均时长,其中,每一知识类型的访问平均时长,是知识类型的访问总时长与知识类型的访问总次数之比。

步骤304,将第二用户的访问特征和第二用户的基本信息输入经过训练的预测模型,得到第二用户的健康意识参数。

其中,预测模型,已学习得到访问特征和基本信息,与健康意识参数之间的映射关系。

本申请实施例中,基本信息可以包括年龄、性别、身高、体重或身高体重指数(BodyMass Index,简称BMI)中的至少一个。

本申请实施例中,由于预测模型已学习得到访问特征和基本信息,与健康意识参数之间的映射关系,因此,在提取到第二用户的访问特征后,可以将第二用户的访问特征和第二用户的基本信息输入预测模型,由预测模型输出得到第二用户的健康意识参数。

本申请实施例的健康意识参数的检测方法,针对未参与调查问卷答题的第二用户,可以根据第二用户对知识图谱中各节点关联的网络资源的访问行为,预测第二用户的健康意识参数,可以提升该方法的适用性。

在本申请实施例的一种可能的实现方式中,为了提升预测模型预测结果的准确性,可以根据已参与调查问卷答题的第一用户对网络资源的访问行为和第一用户的基本信息,对预测模型进行训练。下面结合实施例四,对上述过程进行详细说明。

图6为本申请实施例四所提供的健康意识参数的检测方法的流程示意图。

如图6所示,在图4所示实施例的基础上,步骤304之前,该健康意识参数的检测方法还可以包括以下步骤:

步骤401,监测第一用户对网络资源的访问行为。

步骤402,对第一用户的访问行为进行特征提取,以得到第一用户的访问特征。

本申请实施例中,第一用户的访问行为可以包括第一用户对各节点所关联网络资源的访问次数和访问时长。

本申请实施例中,访问特征可以包括各知识类型的访问总次数、各知识类型的访问总时长、各知识类型的访问平均时长。

步骤403,根据第一用户的访问特征和第一用户的基本信息,生成训练样本,并采用第一用户的健康意识参数对训练样本进行标注。

本申请实施例中,第一用户均具有经过步骤104确定的健康意识参数,可以根据第一用户的访问特征和第一用户的基本信息,生成训练样本,并采用第一用户的健康意识参数对训练样本进行标注,得到标注后的训练样本。

步骤404,采用标注的训练样本,对预测模型进行训练。

例如,参见图7,图7为本申请实施例中基于访问行为评估健康意识参数的流程示意图。例如,可以基于第一用户的基本信息、七个目标节点的访问数据和健康意识参数,利用机器学习技术建立预测模型,比如特征字段可以包括:年龄、性别、身高、体重、BMI、慢性病访问总次数、慢性病访问总时长、慢性病访问平均时长、急性病访问总次数、急性病访问总时长、急性病访问平均时长、心理疾病访问总次数、心理疾病访问总时长、心理疾病访问平均时长、家庭用药访问总次数、家庭用药访问总时长、家庭用药访问平均时长、科学睡眠访问总次数、科学睡眠访问总时长、科学睡眠访问平均时长、运动访问总次数、运动访问总时长、运动访问平均时长、饮食营养访问总次数、饮食营养访问总时长、饮食营养访问平均时长。其中,预测模型可以使用梯度提升决策树。

训练得到基于访问记录预测健康意识参数的预测模型M,对于一个未参与调查问卷作答的第二用户,只需要根据第二用户的基本信息和访问记录,就可以调用预测模型M预测该第二用户的健康意识参数。由此,即使用户未参与调查问卷的作答,也能实现根据该用户的访问行为,预测该用户的健康意识参数,可以提升该方法的适用性。

为了实现上述实施例,本申请还提出一种健康意识参数的检测装置。

图8为本申请实施例五所提供的健康意识参数的检测装置的结构示意图。

如图8所示,该健康意识参数的检测装置100可以包括:图谱获取模块110、抽取模块120、概率获取模块130以及确定模块140。

其中,图谱获取模块110,用于获取知识图谱;其中,知识图谱中各节点具有关联的测试题目。

抽取模块120,用于从知识图谱各节点关联的测试题目中抽取出至少一个目标题目。

概率获取模块130,用于获取第一用户对各目标题目作答的正确概率。

确定模块140,用于根据各目标题目的正确概率,以及各目标题目设定的可猜测性,确定第一用户的健康意识参数;其中,可猜测性,是根据目标题目的选项的个数和题目类型确定的,用于指示随机选出的选项是目标题目的标准答案的概率。

进一步地,在本申请实施例的一种可能的实现方式中,知识图谱中各节点还具有关联的网络资源,在图8所示实施例的基础上,该健康意识参数的检测装置100还可以包括:

检测模块,用于监测第二用户对网络资源的访问行为。

提取模块,用于对第二用户的访问行为进行特征提取,以得到第二用户的访问特征。

预测模块,用于将第二用户的访问特征和第二用户的基本信息输入经过训练的预测模型,得到第二用户的健康意识参数;其中,预测模型,已学习得到访问特征和基本信息,与健康意识参数之间的映射关系。

进一步地,在本申请实施例的一种可能的实现方式中,该健康意识参数的检测装置100还可以包括:

训练模块,用于监测第一用户对网络资源的访问行为,并对第一用户的访问行为进行特征提取,以得到第一用户的访问特征,根据第一用户的访问特征和第一用户的基本信息,生成训练样本,并采用第一用户的健康意识参数对训练样本进行标注,采用标注的训练样本,对预测模型进行训练。

进一步地,在本申请实施例的一种可能的实现方式中,访问行为包括对各节点所关联网络资源的访问次数和访问时长;访问特征,包括各知识类型的访问总次数和访问总时长;其中,每一知识类型对应知识图谱中的一个目标节点,各目标节点与知识图谱中的根节点存在直接父子关系;每一知识类型的访问总次数,是对目标节点存在直接或间接父子关系的各子节点统计关联网络资源的访问次数得到;每一知识类型的访问总时长,是对目标节点存在直接或间接父子关系的各子节点统计关联网络资源的访问时长得到。

进一步地,在本申请实施例的一种可能的实现方式中,每一网络资源属于一种多媒体资源类型;访问总次数,是依据各多媒体资源类型对应的权重,对各子节点关联的网络资源的访问次数加权求和得到;访问总时长,是依据各多媒体资源类型对应的权重,对各子节点关联的网络资源的访问时长加权求和得到。

进一步地,在本申请实施例的一种可能的实现方式中,访问特征还包括各知识类型的访问平均时长;其中,每一知识类型的访问平均时长,是知识类型的访问总时长与知识类型的访问总次数之比。

进一步地,在本申请实施例的一种可能的实现方式中,基本信息包括年龄、性别、身高、体重或身高体重指数中的至少一个。

进一步地,在本申请实施例的一种可能的实现方式中,确定模块140,具体用于:对每一目标题目,将目标题目的正确概率,以及目标题目的可猜测性,代入预测公式中,得到包含未知参数的预测方程;其中,未知参数包括健康意识参数;对各目标题目的预测方程,采用最大似然估计算法求解,得到健康意识参数。

进一步地,在本申请实施例的一种可能的实现方式中,未知参数还包括各目标题目的难度和区分度。

需要说明的是,前述对健康意识参数的检测方法实施例的解释说明也适用于该实施例的健康意识参数的检测装置,此处不再赘述。

本申请实施例的健康意识参数的检测装置,通过获取知识图谱;其中,知识图谱中各节点具有关联的测试题目;从知识图谱各节点关联的测试题目中抽取出至少一个目标题目;获取第一用户对各目标题目作答的正确概率;根据各目标题目的正确概率,以及各目标题目设定的可猜测性,确定第一用户的健康意识参数。由此,无需离线对用户的健康意识参数进行检测,从而无需招募受测人员,可以降低检测成本,并提升检测的覆盖面。并且,根据各目标题目的正确概率,以及各目标题目设定的可猜测性,确定用户的健康意识参数,相较于现有技术中直接使用调查问卷得分来表征用户的健康意识参数的方式,可以提升检测结果的合理性和可靠性。

为了实现上述实施例,本申请还提出一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时,实现如本申请前述实施例提出的健康意识参数的检测方法。

为了实现上述实施例,本申请还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请前述实施例提出的健康意识参数的检测方法。

为了实现上述实施例,本申请还提出一种计算机程序产品,当计算机程序产品中的指令处理器执行时,执行如本申请前述实施例提出的健康意识参数的检测方法。

图9示出了适于用来实现本申请实施方式的示例性电子设备的框图。图9显示的电子设备12仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。

如图9所示,电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。

总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。

电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。

存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图9未显示,通常称为“硬盘驱动器”)。尽管图9中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read OnlyMemory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。

具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本申请所描述的实施例中的功能和/或方法。

电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该电子设备12交互的设备通信,和/或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local Area Network;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与电子设备12的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现前述实施例中提及的方法。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。

应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号