首页> 中国专利> 用户行为数据的上传方法、用户行为的识别方法及装置

用户行为数据的上传方法、用户行为的识别方法及装置

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明提供了一种用户行为数据的上传方法、用户行为的识别方法及装置，包括：采集终端获取预定时长的时间段内用户的加速度数据，根据该加速度数据确定并记录该时间段内该用户的行为种类；按照预设周期，统计该预设周期内记录的该用户各种行为种类的出现频率，并生成动频向量，所述动频向量的各个分量是按照预定顺序排序后的各种行为种类，且各个分量的值是对应各种行为种类的出现频率；将所述动频向量上传至平台。本发明降低了对硬件的处理能力的要求和对采集终端的传输能力的要求，最终实现了在不增加成本的基础上对用户的行为进行识别。

著录项

公开/公告号CN105574471A

专利类型发明专利
公开/公告日2016-05-11

原文格式PDF
申请/专利权人中国移动通信集团公司;
展开▼

申请/专利号CN201410532912.3
发明设计人姚振杰;张志鹏;王俊艳;许利群;
展开▼

申请日2014-10-10
分类号G06K9/00(20060101);
代理机构11243 北京银龙知识产权代理有限公司;
代理人许静;黄灿
地址 100032 北京市西城区金融大街29号
入库时间 2023-12-18 15:12:16

法律信息

法律状态公告日

法律状态信息

法律状态
2019-02-05

授权

授权
2016-06-08

实质审查的生效 IPC(主分类):G06K9/00 申请日:20141010

实质审查的生效
2016-05-11

公开

公开

说明书

技术领域

本发明涉及数据业务技术领域，尤其是涉及一种用户行为数据的上传方法、用户行为的识别方法及装置。

背景技术

详细的用户活动识别可以全面监测用户活动，形成活动日志，记录用户的主要活动，并可在此基础上，根据用户的活动分析结果，对用户进行运动指导和建议，全面改善用户的身体健康状况。

现有技术中通常通过加速度原始数据识别用户行为，现有行为识别算法是基于加速度原始数据进行特征提取与分类器识别。直接采用这些算法实现行为分析有两种策略：(1)增强终端传输能力，将原始数据或特征上传到后端平台计算；(2)增强终端计算能力，在终端实现行为识别；而实际应用中，这两种策略都很难实现。其中(1)需要的数据传输量大，会增加系统能耗和硬件成本； (2)需要较强的硬件处理能力，会增加硬件成本。两者均不适合目前穿戴式设备广泛采用的低成本、低功耗硬件平台。

发明内容

本发明的目的是提供一种用户行为数据的上传方法、用户行为的识别方法及装置，克服了在行为分析中增强终端传输能力，将原始数据或特征上传至后端平台计算这种策略存在的缺陷，同时克服了增强终端计算能力，在终端实现行为识别这种策略存在的缺陷。

为了实现上述目的，本发明提供了一种用户行为数据的上传方法，包括：采集终端获取预定时长的时间段内用户的加速度数据，根据该加速度数据确定并记录该时间段内该用户的行为种类；按照预设周期，统计该预设周期内记录的该用户各种行为种类的出现频率，并生成动频向量，所述动频向量的各个分量是按照预定顺序排序后的各种行为种类，且各个分量的值是对应各种行为种类的出现频率；将所述动频向量上传至平台。

可选的，所述加速度数据包括三轴加速度数值，所述根据该加速度数据确定并记录该时间段内该用户的行为种类包括：计算所述三轴加速度数值的平方的和值；确定所述和值所属的预设数值区间，并将所述预设数值区间对应的行为种类，作为该时间段内该用户的行为种类，其中，不同的行为种类对应于不同的预设数值区间。

可选的，所述预定时长的范围为1～60S。

依据本发明的另一个方面，提供了一种用户行为的识别方法，包括：接收采集终端周期性发送的动频向量，所述动频向量的各个分量是按照预定顺序排序后的各种行为种类，各个分量的值是对应各种行为种类在预设周期内的出现频率，所述行为种类是根据预定时长的时间段内用户的加速度数据所确定的；基于所述动频向量识别该用户的行为。

可选的，在所述基于所述动频向量识别该用户的行为之后，所述方法还包括：将该用户的行为传送至该用户的显示终端。

可选的，所述基于所述动频向量识别该用户的行为包括：对所述动频向量与各种行为种类的特征向量进行比较，将与所述动频向量最为相似的特征向量的行为种类，作为该用户在所述预设周期的行为种类。

可选的，所述对所述动频向量与各种行为种类的特征向量进行比较，将与所述动频向量最为相似的特征向量的行为种类作为该用户在所述预设周期的行为种类，包括：计算所述动频向量与所述特征向量的最大相似性；将最大相似性对应的特征向量的行为种类作为该用户在所述预设周期的行为种类。

可选的，在对所述动频向量与各种行为种类的特征向量进行比较之前，进一步按照预设权重，对所述动频向量的各个分量进行加权，其中，各个分量具有预设的重要性指标，重要性指标较高的分量具有较高的权重。

依据本发明的另一个方面，提供了一种采集终端，包括：获取模块，用于获取预定时长的时间段内用户的加速度数据，根据该加速度数据确定并记录该时间段内该用户的行为种类；处理模块，用于按照预设周期，统计该周期内记录的该用户各种行为种类的出现频率，并生成动频向量，所述动频向量的各个分量是按照预定顺序排序后的各种行为种类，且各个分量的值是对应各种行为种类的出现频率；第一传输模块，用于将所述动频向量上传至平台。

可选的，所述获取模块包括第一计算单元和第一比较单元，所述第一计算单元用于计算所述三轴加速度数值的平方的和值；所述第一比较单元用于确定所述和值所属的预设数值区间，并将所述预设数值区间对应的行为种类，作为该时间段内该用户的行为种类，其中，不同的行为种类对应于不同的预设数值区间。

可选的，所述获取模块获取预定时长的时间段内用户的加速度数据中的预定时长的范围为1～60S。

依据本发明的另一个方面，提供了一种用户行为的识别系统，包括：接收模块，用于接收采集终端周期性发送的动频向量，所述动频向量的各个分量是按照预定顺序排序后的各种行为种类，各个分量的值是对应各种行为种类在预设周期内的出现频率，所述行为种类是根据预定时长的时间段内用户的加速度数据所确定的；识别模块，用于基于所述动频向量识别该用户的行为。

可选的，所述识别系统还包括第二传输模块，所述第二传输模块用于将该用户的行为传送至该用户的显示终端。

可选的，所述识别模块包括第二比较单元，所述第二比较单元用于对所述动频向量与各种行为种类的特征向量进行比较，将与所述动频向量最为相似的特征向量的行为种类，作为该用户在所述预设周期的行为种类。

可选的，所述第二比较单元用于对所述动频向量与各种行为种类的特征向量进行比较，将与所述动频向量最为相似的特征向量的行为种类，作为该用户在所述预设周期的行为种类包括：计算所述动频向量与所述特征向量的最大相似性；将最大相似性对应的特征向量的行为种类作为该用户在所述预设周期的行为种类。

可选的，所述识别模块还包括第二计算单元，所述第二计算单元用于，在对所述动频向量与各种行为种类的特征向量进行比较之前，进一步按照预设权重，对所述动频向量的各个分量进行加权，其中，各个分量具有预设的重要性指标，重要性指标较高的分量具有较高的权重。

本发明的有益效果是：本发明通过在采集终端对采集到的加速度数据进行处理形成动频向量，然后将动频向量上传至平台，平台基于动频向量识别该用户的行为，本发明通过采集终端与平台的结合，避免了在采集终端进行复杂的运算，降低了对硬件的处理能力的要求，从而减少了硬件成本，另外，通过将动频向量上传至平台，降低了对采集终端的传输能力的要求，从而减少了采集终端的能量消耗，最终实现了在不增加成本的基础上，对用户的行为进行识别。

附图说明

图1表示本发明的实施例中采集终端在用户行为数据的上传方法中的步骤流程图；

图2表示本发明的实施例中平台在用户行为的识别方法中的步骤流程图；

图3表示本发明的实施例中平台基于动频向量识别该用户的行为的步骤流程图；

图4表示本发明的实施例中RAD数据库中展示的一条分析结果中的用户的加速度数据；

图5表示根据图4中的加速度数据得出的识别结果；

图6表示本发明的实施例中采集终端的结构框图；以及

图7表示本发明的实施例中的识别系统的结构框图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

如图1所示，为本发明的实施例中采集终端在用户行为数据的上传方法中的步骤流程图，包括如下步骤：

步骤S101，获取预定时长的时间段内用户的加速度数据，根据加速度数据确定并记录该时间段内该用户的行为种类。

在本实施例中，采集终端获取预定时长的时间段内用户的加速度数据，优选的，在采集终端，为减少内存占用，所述预定时长的范围可以为1～60S。

优选的，加速度数据可以为三轴加速度三个轴向上的数值，采集终端可以通过对三轴加速度三个轴向的数值进行处理来得到该用户的行为种类。具体处理可以是，根据三个轴向的加速度数值进行初步处理，得到一个处理结果；然后，确定该处理结果对应的行为种类，并作为该时间段内该用户的行为种类。

举例来说，初步处理可以是，计算三轴加速度三个轴向数值的平方的和值。采集终端先计算三轴加速度三个轴向数值的平方的和值，假设预定时长为2S，则在每一个2S的时间段内计算一个三轴加速度三个轴向数值的平方的和值。上述初步处理还可以是：计算三轴加速度三个轴向数值的平方根，然后再对三个轴向得到的平方根进行求和计算，得到一个和值；或者是计算三轴加速度三个轴向数值的平方的和值后，再计算和值的方差值；或者是计算三轴加速度三个轴向数值的绝对值的和值，等等。即，对三轴加速度的数值的处理，可以根据具体环境和统计经验来自行选择，并不局限于以上的举例。

若对三个轴向的加速度数值进行初步处理的方式为计算三轴加速度三个轴向数值的平方的和值，则在计算所述和值后，可以确定所述和值所属的预设数值区间，并将所述预设数值区间对应的行为种类，作为该时间段内该用户的行为种类，其中，预先设定不同的行为种类对应于不同的预设数值区间。例如，在所述采集终端内预先设有不同行为种类所对应的数值区间，在计算得到三轴加速度数值的平方的和值后，将该和值与不同的数值区间进行对比，确定该和值位于哪个数值区间，假设该和值位于第一数值区间，则第一数值区间所对应的行为种类即为该和值所属的行为种类。

若对三个轴向的加速度数值进行初步处理的方式为计算三轴加速度三个轴向数值的平方的和值，再对该和值进行方差计算得到的方差值，那么本发明实施例中可以将该方差值与不同的数值区间进行对比，确定该方差值位于哪个数值区间，假设该方差值位于第二数值区间，则第二数值区间所对应的行为种类即为该方差值所属的行为种类。方差值的计算量较小，且更能够反映出用户加速度的变化规律，本发明实施例在采集终端侧可优选地采用方差值来确定用户的行为种类。

步骤S102，按照预设周期，统计该预设周期内记录的该用户各种行为种类的出现频率，并生成动频向量。

在本实施例中，所述动频向量的各个分量是按照预定顺序排序后的各种行为种类，各个分量的值是对应行为种类的出现频率。在此以具体实施例进行说明，若各种行为种类分别为静止、乘车、骑行、活动和锻炼5种行为种类，则所述动频向量的各个分量按照预定顺序排序后分别为静止、乘车、骑行、活动和锻炼，所述动频向量的各个分量的值分别为静止、乘车、骑行、活动和锻炼5 种行为种类的出现频率，假设静止、乘车、骑行、活动和锻炼5种行为种类的出现频率分别为D1、D2、D3、D4、D5，即动频向量D＝(D1，D2，D3，D4， D5)。

可选的，预设周期可以以小时为单位进行设定，也可以以天为单位进行设定，即预设周期并不局限于具体的时间限定，假设预设周期为5Min，则采集终端统计该5Min内记录的该用户各种行为种类的出现频率，最后将该用户各种行为种类的出现频率形成动频向量。

步骤S103，将所述动频向量上传至平台，在此需要说明的是，采集终端可以为可穿戴式设备，如计步器。

如图2所示，为本发明的实施例中平台在用户行为的识别方法中的步骤流程图，包括如下步骤：

步骤S201，接收采集终端周期性发送的动频向量，需要说明的是，接收的动频向量与步骤S102中生成的动频向量为同一个动频向量。

步骤S202，基于所述动频向量识别该用户的行为，获得所述动频向量的信息后，通过对所述动频向量进行处理最后得到该用户的行为识别结果。

优选的，在识别用户的行为后，还可以将该用户的行为传送至该用户的显示终端，其中，显示终端可以为电脑、手机等。

如图3所示，为图2中步骤S202的进一步细化的流程图，包括如下步骤：

步骤S301，对所述动频向量的各个分量进行加权。

在本实施例中，平台内预设有动频向量的各个分量的权重，将所述动频向量的各个分量分别按照各个分量的权重进行加权；优选的，各个分量具有预设的重要性指标，重要性指标较高的分量则具有较高的权重，即用户不同的行为种类对应的权重是不同的。在此以具体实施例进行说明，假设各种行为种类分别为静止、乘车、骑行、活动和锻炼5种行为种类，由于静止、乘车、骑行、活动和锻炼5种行为种类中都会有静止行为的出现，因此静止行为对用户行为的识别贡献最小，则静止行为的重要性指标就最低，权重则最小；相反，锻炼行为通常只出现在锻炼行为种类中，静止、乘车、骑行、活动等行为种类中很少会出现锻炼行为，因此锻炼行为对用户行为的识别贡献是最大的，则锻炼行为的重要性指标就最高，权重则最大；当静止、乘车、骑行、活动和锻炼5种行为种类的权重确定后，则按照该权重对动频向量的各个分量分别进行加权。

步骤S302，对所述动频向量与各种行为种类的特征向量进行比较。

在本实施例中，平台中预设有各种行为种类的特征向量。优选的，平台中包括有分类器，分类器中存储了各种行为种类的特征向量，若所述特征向量没有进行过加权，则对所述动频向量与特征向量进行比较；若所述特征向量为加权后的特征向量，则对加权后的动频向量与加权后的特征向量进行比较。

步骤S303，计算所述动频向量与所述特征向量的最大相似性，将最大相似性对应的特征向量的行为种类作为该用户在预设周期的行为种类。

在本实施例中，优选的，计算所述动频向量与所述特征向量的相似性中所采用的计算方法为余弦距离度量相似性的方法，所述余弦距离定义为

$Sim (X, Y) = \cos θ = \frac{x_{1} y_{1} + x_{2} y_{2} + . . . . . . + x_{n} y_{n}}{\sqrt{x_{1}^{2} + x_{2}^{2} + . . . . . . + x_{n}^{2}} \sqrt{y_{1}^{2} + y_{2}^{2} + . . . . . + y_{n}^{2}}}$

其中，X为所述动频向量，x₁为所述动频向量中的第一个分量，x₂为所述动频向量中的第二个分量，依次类推，x_n为所述动频向量中的第n个向量，Y 为预先确定的所述各种行为种类的的特征向量，y₁为所述特征向量的第一个分量，y₂为所述特征向量的第二个分量，依次类推，y_n为所述特征向量的第n个分量，θ为动频向量X与各种行为种类的的特征向量Y之间的夹角。

在计算所述动频向量与所述特征向量的最大相似性时，将所述动频向量与各种行为种类的特征向量做比较，即分别计算所述动频向量与各种行为种类的特征向量之间夹角的余弦值，余弦值越大，则说明相似度越大，得到最大相似度后，将最大相似性对应的特征向量的行为种类作为该用户在预设周期的行为种类，即该行为种类即为最后的识别结果。

在此举例进行说明，假设各种行为种类分别为静止、乘车、骑行、活动和锻炼5种行为种类，静止行为的特征向量为Y₁，乘车行为的特征向量为Y₂，骑行行为的特征向量为Y₃，活动行为的特征向量为Y₄，锻炼行为的特征向量为 Y₅，动频向量为D，则分别计算动频向量D与静止行为的特征向量Y₁、乘车行为的特征向量Y₂、骑行行为的特征向量Y₃、活动行为的特征向量Y₄、锻炼行为的特征向量Y₅之间的相似度，即分别计算动频向量D与静止行为的特征向量 Y₁、乘车行为的特征向量Y₂、骑行行为的特征向量Y₃、活动行为的特征向量 Y₄、锻炼行为的特征向量Y₅之间夹角的余弦值，余弦值越大，则说明相似度越大，取最大相似度相对应的特征向量的行为种类为该动频向量所属的行为种类，即该用户在预设周期内的行为种类，也即为最后的行为识别结果。

在此需要说明的是，上述识别结果可能包含个别偶发的错误，可以根据生活经验对识别结果进行后处理。例如，多个日常活动中夹杂一个5分钟的剧烈运动，通常是误判，可以去除。长时间静止过程中突发的5分钟乘车也很有可能是误判，可以予以去除。

下面结合实例说明该识别方法的有益效果。

如图4所示，图4为RAD数据库中展示的一条分析结果中的用户的加速度数据，该数据可以作为提示辅助用户对数据进行标注。由图4中可以看出数据采集时长约2小时5分钟。实际情况是10分钟整理物品并步行至停车场(日常活动)，35分钟驾驶，25分钟打篮球，5分钟步行，15分钟驾驶，5分钟从停车场步行至家中，然后一直静止。

图5表示根据图4中的加速度数据得出的识别结果，图5将用户各种行为种类划分为静止、乘车、骑行、活动和锻炼5种行为种类，由图5中可以看出该结果与用户结合记忆与步数信息的标注结果几乎完全相符，只有1.5小时处发生一次错误，即最后一次活动。这段活动为从停车场步行至家中，5分钟内包括停车、步行、乘坐电梯以及在家里坐下，由于5分钟活动复杂，最终被错误的综合识别为骑行。

这种错误是可以理解的，由于5分钟内包含多次状态转换，状态的过度点(即从一个状态切换到另一个状态的时段)会造成采集终端识别产生错误，进而平台也会产生错误。RAD数据集上的测试结果表明，识别准确率达到94.21％。

如图6所示，为本发明的实施例中采集终端的结构框图，采集终端400包括：

获取模块401，用于获取预定时长的时间段内用户的加速度数据，根据该加速度数据确定并记录该时间段内该用户的行为种类；

处理模块402，用于按照预设周期，统计该周期内记录的该用户各种行为种类的出现频率，并生成动频向量，所述动频向量的各个分量是按照预定顺序排序后的各种行为种类，且各个分量的值是对应各种行为种类的出现频率；

第一传输模块403，用于将所述动频向量上传至平台。

可选的，获取模块401包括第一计算单元和第一比较单元，所述第一计算单元用于计算所述三轴加速度数值的平方的和值；所述第一比较单元用于确定所述和值所属的预设数值区间，并将所述预设数值区间对应的行为种类，作为该时间段内该用户的行为种类，其中，不同的行为种类对应于不同的预设数值区间。

可选的，获取模块401获取预定时长的时间段内用户的加速度数据中的预定时长的范围为1～60S。

如图7所示，为本发明的实施例中用户行为的识别系统的结构框图，识别系统500包括：

接收模块501，用于接收采集终端周期性发送的动频向量，所述动频向量的各个分量是按照预定顺序排序后的各种行为种类，各个分量的值是对应各种行为种类在预设周期内的出现频率，所述行为种类是根据预定时长的时间段内用户的加速度数据所确定的；

识别模块502，用于基于所述动频向量识别该用户的行为。

可选的，识别系统500还包括第二传输模块，所述第二传输模块用于将该用户的行为传送至该用户的显示终端。

可选的，识别模块502包括第二比较单元，所述第二比较单元用于对所述动频向量与各种行为种类的特征向量进行比较，将与所述动频向量最为相似的特征向量的行为种类，作为该用户在所述预设周期的行为种类。

可选的，识别模块502还包括第二计算单元，所述第二计算单元用于，在对所述动频向量与各种行为种类的特征向量进行比较之前，进一步按照预设权重，对所述动频向量的各个分量进行加权，其中，各个分量具有预设的重要性指标，重要性指标较高的分量具有较高的权重。

以上所述的是本发明的优选实施方式，应当指出对于本技术领域的普通人员来说，在不脱离本发明所述的原理前提下还可以作出若干改进和润饰，这些改进和润饰也在本发明的保护范围内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 用户行为数据的上传方法、用户行为的识别方法及装置 [P] . 中国专利： CN105574471B . 2019.02.05
2. 一种基于用户文本数据和通讯数据的行为异常用户识别方法 [P] . 中国专利： CN112699217A . 2021-04-23
3. Method and apparatus for inducing user's behavior based on analysis of user's behavior data using AI learning model [P] . KR20210028550A . 2021-03-12

机译：基于使用AI学习模型的用户行为数据的分析来诱导用户行为的方法和装置
4. Method and apparatus for inducing user's behavior based on analysis of user's behavior data using AI learning model [P] . 韩国专利： KR102065399B1 . 2020-01-14

机译：基于AI学习模型的用户行为数据分析，诱导用户行为的方法和装置
5. Method and analysis device for determining user data that describes a user behavior in a motor vehicle [P] . 德国专利： DE102018200816B3 . 2019-02-07

机译：用于确定描述机动车中的用户行为的用户数据的方法和分析装置