首页> 中国专利> 一种基于大数据用户行为分析负向反馈自动挖掘方法

一种基于大数据用户行为分析负向反馈自动挖掘方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本申请公开了一种基于大数据用户行为分析负向反馈自动挖掘方法。所述基于大数据用户行为分析负向反馈自动挖掘方法包括：获取用户车辆使用数据池，所述数据池中包括多个车辆使用数据；根据所述数据池中的各个车辆使用数据获取负反馈信息；根据各个负反馈信息获取车辆异常功能信息。本申请所提供的基于大数据用户行为分析负向反馈自动挖掘方法能够准确挖掘用户普遍问题和潜在风险，并且挖掘方式多样化，负反馈模型+负反馈可配置化策略，能够挖掘不同类型不同场景下的问题和风险，整体流程自动化，实现T+1甚至更短的时间内的发现。

著录项

公开/公告号CN116089662A

专利类型发明专利
公开/公告日2023-05-09

原文格式PDF
申请/专利权人中国第一汽车股份有限公司;
展开▼

申请/专利号CN202211484500.8
发明设计人张厚鑫;
展开▼

申请日2022-11-24
分类号G06F16/903(2019.01);
代理机构北京翔宇专利代理事务所(普通合伙) 11960;
代理人田昱川
地址 130011 吉林省长春市汽车经济技术开发区新红旗大街1号
入库时间 2023-06-19 19:33:46

法律信息

法律状态公告日

法律状态信息

法律状态
2023-06-23

实质审查的生效 IPC(主分类):G06F16/903 专利申请号:2022114845008 申请日:20221124

实质审查的生效
2023-05-09

公开

发明专利申请公布

说明书

技术领域

本申请涉及车辆功能故障技术领域，尤其涉及一种基于大数据用户行为分析负向反馈自动挖掘方法以及基于大数据用户行为分析负向反馈自动挖掘装置。

背景技术

随着智能汽车的兴起，车载功能日益丰富，越来越多的用户通过语音或者GUI方式操作功能并逐渐成为习惯，但是在应用迭代或者语音功能更新过程中，不可避免出现没有测试或者考虑到的问题，没有满足用户需求或者出现产品bug，比如，用户重复多次语音操作空调不成功、用户抱怨唤不醒或者误唤醒、用户听歌过程中APP自动关闭等等，对于这些负向行为，一般都有显性用户反馈和隐性用户反馈，显性用户反馈包含用户骂人、抱怨语料、用户多次语音重复等，隐性用户反馈包含技能中断，使用平均时长低，用户行为路径异常等，这类问题一般主要通过测试人员测试、用户主动上报等，测试过程中也无法完全模拟当时上下文场景环境等等，这种情况往往发现周期过长而且不全面，长期如此用户可能逐渐放弃某些技能或者应用的使用，从发现到修复完善时间过长，对于问题应用的用户留存率降低越快。

因此，希望有一种技术方案来解决或至少减轻现有技术的上述不足。

发明内容

本发明的目的在于提供一种基于大数据用户行为分析负向反馈自动挖掘方法来至少解决上述的一个技术问题。

名词解释：用户session是指用户从使用车机交互开始在一定时间内结束所产生用户行为集合。

本发明提供了下述方案：

根据本发明的一个方面，提供一种基于大数据用户行为分析负向反馈自动挖掘方法，所述基于大数据用户行为分析负向反馈自动挖掘方法包括：

获取用户车辆使用数据池，所述数据池中包括多个车辆使用数据；

根据所述数据池中的各个车辆使用数据获取负反馈信息；

根据各个负反馈信息获取车辆异常功能信息。

可选地，所述根据所述数据池中的各个车辆使用数据获取负反馈信息包括：

根据用户上下文埋点数据对数据池中的各个车辆使用数据进行划分，从而获取用户session；

根据各个用户session获取负反馈信息。

可选地，所述根据各个用户session获取负反馈信息包括：

分别对每个用户session进行如下处理：

判断用户session是否为语音场景，若是，则

获取经过训练的LSTM二分类模型；

提取所述用户session中的语音信息；

提取所述语音信息中的语音特征；

将所述语音特征输入至所述经过训练的LSTM二分类模型，从而获取分类标签，所述分类标签包括负反馈标签，当所述标签为负反馈标签时，所述语音信息为负反馈信息。

可选地，所述根据各个用户session获取负反馈信息进一步包括：

分别对每个用户session进行如下处理：

判断用户session是否为非语音场景，若是，则

获取用户session中的行为路径统计信息；

根据所述行为路径统计信息判断是否存在用户异常行为，若是，则

获取所述用户异常行为作为所述负反馈信息。

可选地，所述基于大数据用户行为分析负向反馈自动挖掘方法进一步包括：

获取历史车辆异常功能数据库，所述历史车辆异常功能数据库包括至少一个历史异常功能信息以及异常频次，一个历史异常功能信息对应一个异常频次；

为每个获取的车辆异常功能信息进行如下判断：

判断获取的车辆异常功能信息是否与所述历史车辆异常功能数据库中的一个历史异常功能信息，若是，则

获取与所述车辆异常功能信息相同的历史异常功能信息所对应的异常频次；

判断异常频次是否超过预设异常频次阈值，若否，则更新所述历史车辆异常功能数据库，将与所述车辆异常功能信息相同的历史异常功能信息所对应的异常频次的次数增加一次。

可选地，所述基于大数据用户行为分析负向反馈自动挖掘方法进一步包括：

判断异常频次是否超过预设异常频次阈值，若是，则

判断该车辆异常功能信息是通过所述语音场景获取还是通过非语音场景获取，若通过语音场景获取，则

获取该语音场景中用户session中的语音信息。

可选地，所述基于大数据用户行为分析负向反馈自动挖掘方法进一步包括：

判断异常频次是否超过预设异常频次阈值，若是，则

判断该车辆异常功能信息是通过所述语音场景获取还是通过非语音场景获取，若通过非语音场景获取，则

获取该语音场景中用户session中的行为路径统计信息。

本申请还提供了一种基于大数据用户行为分析负向反馈自动挖掘装置，所述基于大数据用户行为分析负向反馈自动挖掘装置包括：

用户车辆使用数据池获取模块，所述用户车辆使用数据池获取模块用于获取用户车辆使用数据池，所述数据池中包括多个车辆使用数据；

负反馈信息获取模块，所述负反馈信息获取模块用于根据所述数据池中的各个车辆使用数据获取负反馈信息；

车辆异常功能信息获取模块，所述车辆异常功能信息获取模块用于根据各个负反馈信息获取车辆异常功能信息。

本申请还提供了一种电子设备，所述电子设备包括：处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；存储器中存储有计算机程序，当计算机程序被处理器执行时，使得处理器执行如上所述的基于大数据用户行为分析负向反馈自动挖掘方法。

本申请还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有可由电子设备执行的计算机程序，当计算机程序在电子设备上运行时，使得电子设备执行如上所述的基于大数据用户行为分析负向反馈自动挖掘方法。

本申请所提供的基于大数据用户行为分析负向反馈自动挖掘方法能够准确挖掘用户普遍问题和潜在风险，并且挖掘方式多样化，负反馈模型+负反馈可配置化策略，能够挖掘不同类型不同场景下的问题和风险，整体流程自动化，实现T+1甚至更短的时间内的发现。

附图说明

图1是本申请一实施例中的基于大数据用户行为分析负向反馈自动挖掘方法的流程示意图。

图2是本申请一个实施例提供的基于大数据用户行为分析负向反馈自动挖掘方法的一种电子设备结构框图。

图3是本申请一个实施例中的基于大数据用户行为分析负向反馈自动挖掘方法的详细流程示意图。

图4为本申请一实施例中的用户session示意图。

具体实施方式

下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1是本申请一实施例中的基于大数据用户行为分析负向反馈自动挖掘方法的流程示意图。

如图1所示的基于大数据用户行为分析负向反馈自动挖掘方法包括：

步骤1：获取用户车辆使用数据池，所述数据池中包括多个车辆使用数据；

步骤2：根据所述数据池中的各个车辆使用数据获取负反馈信息；

步骤3：根据各个负反馈信息获取车辆异常功能信息。

在本实施例中，所述根据所述数据池中的各个车辆使用数据获取负反馈信息包括：

根据用户上下文埋点数据对数据池中的各个车辆使用数据进行划分，从而获取用户session；具体地，按照用户分组并进行时间排序，根据特定时间范围(例如取5分钟内用户埋点数据)或者用户行为特定结束标记进行划分(例如导航到达目的地、音乐播放关闭等)。

根据各个用户session获取负反馈信息。

在本实施例中，所述根据各个用户session获取负反馈信息包括：

分别对每个用户session进行如下处理：

判断用户session是否为语音场景，若是，则

获取经过训练的LSTM二分类模型；

提取所述用户session中的语音信息；

提取所述语音信息中的语音特征；

在本实施例中，所述根据各个用户session获取负反馈信息进一步包括：

分别对每个用户session进行如下处理：

判断用户session是否为非语音场景，若是，则

获取用户session中的行为路径统计信息；

根据所述行为路径统计信息判断是否存在用户异常行为，若是，则

获取所述用户异常行为作为所述负反馈信息。

在本实施例中，所述基于大数据用户行为分析负向反馈自动挖掘方法进一步包括：

为每个获取的车辆异常功能信息进行如下判断：

判断获取的车辆异常功能信息是否与所述历史车辆异常功能数据库中的一个历史异常功能信息，若是，则

获取与所述车辆异常功能信息相同的历史异常功能信息所对应的异常频次；

在本实施例中，所述基于大数据用户行为分析负向反馈自动挖掘方法进一步包括：

判断异常频次是否超过预设异常频次阈值，若是，则

判断该车辆异常功能信息是通过所述语音场景获取还是通过非语音场景获取，若通过语音场景获取，则

获取该语音场景中用户session中的语音信息。

在本实施例中，所述基于大数据用户行为分析负向反馈自动挖掘方法进一步包括：

判断异常频次是否超过预设异常频次阈值，若是，则

判断该车辆异常功能信息是通过所述语音场景获取还是通过非语音场景获取，若通过非语音场景获取，则

获取该语音场景中用户session中的行为路径统计信息。

下面以举例的方式对本申请进行进一步详细阐述，可以理解的是，该举例并不构成对本申请的任何限制。

获取用户车辆使用数据池，所述数据池中包括多个车辆使用数据，具体而言，用户在使用车辆时，每一个动作均会产生相应的行为日志，清洗整理后采集到用户车辆使用数据池中，基于用户车辆使用数据池中的数据，进行第一步挖掘，根据用户上下文埋点数据划分用户session，可以理解短时间内用户某些关联操作内所有数据。

根据所述数据池中的各个车辆使用数据获取负反馈信息，具体而言，参见图3，对用户session进行判断，语音场景下有如下策略，敏感词命中超过2次，用户近似重复话术超过2次等，其他场景，应用异常中断检测，例如，音乐播放异常停止，网络异常，APP闪退，对于特定应用也可以配置化策略，例如，导航、音乐搜索失败率，应用平均使用时长、步长等，命中其中一个或多个策略则判断为负反馈信息。

模型对于用户session判断，语音场景，使用基于简单的LSTM二分类模型作为用户情感分析模型，判断session内的文本属于正向还是负向行为，对于其他隐性负向反馈，可以使用用户异常行为路径检测算法，例如导航正常路径是用户关键词搜索，然后选择点击出发，异常情况，用户多次搜索，或者点击出发在取消又重新搜索，基于用户异常路径统计和检测，可以发现产品优化点和异常原因。

在本实施例中，用户session为语音场景时，获取负反馈信息即可以通过上述的敏感词获取，也可以通过上述的LSTM二分类模型，还可以配合两者使用，并且可以设置一定的条件，例如，假设通过敏感词获取，还可以结合场景判断加上词频率，比如3分钟内命中两次，则认为是负反馈信息。

在本实施例中，图3所示的用户情感分析模型为LSTM二分类模型，可以理解的是，还可以采用其他模型。

在本实施例中，对日志数据处理主要是使用日志中用户语音文本。异常分析报表是其中的一方面应用，技术方案为，基于已经挖掘到的case通过大数据平台家调度系统进行分析统计并，每日例行化运行，数据存储到数据库中，通过报表工具例如tableau等进行展示，按照业务需求可以分为不同应用不同技能下的异常报表，可以设计多维度指标，比如：异常埋点占比，异常用户占比，异常平均点击频次等。至于如何进行风险评估，基于当前报表数据如果超出异常阈值或者变化趋势明显此时进行报警。

参见图4，在本实施例中，用户session通过日志数据清洗加工得到的，这部分数据也会存到数据库中并进行使用，以导航session举例来说，导航session例如图4所示。

各个获取到的负反馈信息可以组成一个负反馈数据库。

通过负反馈数据库，我们可以进行如下操作：

基于负反馈数据库，可以丰富负反馈样本及语料，训练新的负反馈模型并上线打分

基于负反馈数据库，可以例行统计异常情况变化趋势、占比以及相关用户留存和使用情况，并对照大盘反馈出异常点，及时通知相关开发人员进行优化，抽取badcase供给开发人员详细分析，基于现有异常情况变化可以更新负反馈策略，开发人员优化修复后，需要持续观察相关指标变化。

可以理解的是，在获取到负反馈信息后，还可以获取到底是什么功能没有实现，从而导致用户提供了负反馈信息。举例来说，当使用者使用导航功能，如果使用者想导航去某地，例如，使用者对语音说，请导航到A地，但是，导航并没有实现这个目的，例如，导航没有导航到A地，此时，使用者就可能说，导航你真不好用，这种语音即为负反馈信息，其中不好用等词可以是敏感词。

当获取该负反馈信息后，就可以反推出是什么功能出现问题，例如，此处即为导航功能出现问题。

在实际使用中，某些功能可能仅仅是临时出现问题或者由于其他外因(例如当时环境嘈杂，没有识别出语音含义等)原因导致的，因此，并不一定是功能本身出现问题，此时，通过历史车辆异常功能数据库中该问题出现的异常频次可以判断该功能是否经常出现问题，如果出现问题达到了一定次数，认为该功能确实出现问题，如果不是，则仅仅记录该功能的出现问题的频次。

本申请还提供了一种基于大数据用户行为分析负向反馈自动挖掘装置，所述基于大数据用户行为分析负向反馈自动挖掘装置包括用户车辆使用数据池获取模块，负反馈信息获取模块以及车辆异常功能信息获取模块，

用户车辆使用数据池获取模块用于获取用户车辆使用数据池，所述数据池中包括多个车辆使用数据；

负反馈信息获取模块用于根据所述数据池中的各个车辆使用数据获取负反馈信息；

车辆异常功能信息获取模块用于根据各个负反馈信息获取车辆异常功能信息。

本发明解决的问题及产生的效益有如下几点：

1.准确、全面发现普遍用户问题，基于大数据挖掘能够发现大部分用户普遍问题，准确评估问题带来的影响面，为产品迭代改进优先级提供方向、决策支持，重点问题优先解决，同时，基于大数据，完整找到当时用户上下文埋点和环境，实现综合判断，相比较于单一用户行为挖掘更能发现更多问题，也能得到更加详细负向行为的判断支撑

2.负向反馈发现方式灵活、适配不同场景和业务，用户负向反馈行为在不同场景下有不同表现，主要分为显性反馈和隐性反馈，基于现有数据和业务，灵活配置，采用显性加隐性或者隐性挖掘，语音场景下可能会发出抱怨骂人语料，通过用户情感分析模型加上敏感关键词命中情况综合判断，导航场景下在不满足用户需求下，可能会多次搜索、变换关键词等，可以通过用户异常路径检测加上平均搜索次数等方式综合判断

3.挖掘流程自动化，配置化，基于现有技术框架，实现全流程自动化挖掘，更新时间可以是T+1甚至小时级别，主动发现问题，而不是被动挖掘，及时发现用户异常行为

4.跟踪观察，持续优化，问题反馈修复后，需要一段时间观察效果得到验证或者发现新的问题，本发明支持每日更新，对相关问题进行分类统计，计算相关变化趋势展示给开发人员，如果没有达到效果，需要继续持续优在不断观察

5.良性循环，完整闭圈，不断积累挖掘出的负反馈数据，可以持续训练优化负反馈模型，然后再将新模型应用于线上实现良性循环，最后可以得到效果良好鲁棒性更高的模型，同时，基于这些数据进行分析，可以不断总结反馈开发过程中遇到的问题，避免迭代过程中重复踩坑。

图2是本发明一个或多个实施例提供的一种电子设备结构框图。

如图2所示，本申请还公开了一种电子设备，包括：处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；存储器中存储有计算机程序，当计算机程序被处理器执行时，使得处理器执行基于大数据用户行为分析负向反馈自动挖掘方法的步骤。

本申请还提供了一种计算机可读存储介质，其存储有可由电子设备执行的计算机程序，当计算机程序在电子设备上运行时，使得电子设备执行基于大数据用户行为分析负向反馈自动挖掘方法的步骤。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，PCI)总线或扩展工业标准结构(Extended IndustryStandardArchitecture，EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

电子设备包括硬件层，运行在硬件层之上的操作系统层，以及运行在操作系统上的应用层。该硬件层包括中央处理器(CPU，Central Processing Unit)、内存管理单元(MMU，Memory Management Unit)和内存等硬件。该操作系统可以是任意一种或多种通过进程(Process)实现电子设备控制的计算机操作系统，例如，Linux操作系统、Unix操作系统、Android操作系统、iOS操作系统或windows操作系统等。并且在本发明实施例中该电子设备可以是智能手机、平板电脑等手持设备，也可以是桌面计算机、便携式计算机等电子设备，本发明实施例中并未特别限定。

本发明实施例中的电子设备控制的执行主体可以是电子设备，或者是电子设备中能够调用程序并执行程序的功能模块。电子设备可以获取到存储介质对应的固件，存储介质对应的固件由供应商提供，不同存储介质对应的固件可以相同可以不同，在此不做限定。电子设备获取到存储介质对应的固件后，可以将该存储介质对应的固件写入存储介质中，具体地是往该存储介质中烧入该存储介质对应固件。将固件烧入存储介质的过程可以采用现有技术实现，在本发明实施例中不做赘述。

电子设备还可以获取到存储介质对应的重置命令，存储介质对应的重置命令由供应商提供，不同存储介质对应的重置命令可以相同可以不同，在此不做限定。

此时电子设备的存储介质为写入了对应的固件的存储介质，电子设备可以在写入了对应的固件的存储介质中响应该存储介质对应的重置命令，从而电子设备根据存储介质对应的重置命令，对该写入对应的固件的存储介质进行重置。根据重置命令对存储介质进行重置的过程可以现有技术实现，在本发明实施例中不做赘述。

为了描述的方便，描述以上装置时以功能分为各种单元、模块分别描述。当然在实施本申请时可以把各单元、模块的功能在同一个或多个软件和/或硬件中实现。

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)，具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语，应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非被特定定义，否则不会用理想化或过于正式的含义来解释。

对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明实施例并不受所描述的动作顺序的限制，因为依据本发明实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本发明实施例所必须的。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器或者网络设备等)执行本申请各个实施方式或者实施方式的某些部分所述的方法。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种基于大数据平台审计日志的用户行为分析方法 [P] . 中国专利：
2. 一种基于大数据挖掘的用户行为分析方法及系统 [P] . 中国专利： CN106777367A . 2017-05-31
3. 基于数据挖掘的用户行为分析方法及用户行为分析装置 [P] . 中国专利： CN107704575A . 2018-02-16
4. USER BEHAVIOR ANALYSIS METHOD AND SYSTEM BASED ON BIG DATA MINING [P] . 世界知识产权组织专利： WO2018137104A1 . 2018-08-02

机译：基于大数据挖掘的用户行为分析方法和系统
5. Automatic signal processing-based learning in process plants, systems and methods for providing big database learning in process plants, systems for automatically implementing big database learning in process plants [P] . 日本专利： JP6868954B2 . 2021-05-12

机译：基于自动信号处理的过程工厂，系统和方法，用于在过程工厂提供大数据库学习的系统和方法，用于自动在过程工厂中实现大数据库学习的系统
6. METHOD AND DEVICE FOR AUTOMATICALLY PUSHING VIDEO BASED ON USER BEHAVIOR ANALYSIS [P] . 世界知识产权组织专利： WO2017148064A1 . 2017-09-08

机译：基于用户行为分析的视频自动推送方法和装置