首页> 中国专利> 投诉行为分析方法、装置、设备及计算机可读存储介质

投诉行为分析方法、装置、设备及计算机可读存储介质

摘要

本发明公开了一种投诉行为分析方法、装置、设备及计算机可读存储介质,包括:实时监测话务平台的投诉热线或投保系统的投诉通道,以获取实时的动态客户投诉信息流;基于预设的滑动窗口以及滑动间隔,获取在所述滑动窗口对应的时间内的动态客户投诉信息流,得到待分析投诉信息;在所述待分析投诉信息满足预设数量条件时,将所述待分析投诉信息输入至客户投诉行为分析模型进行分析,得到所述待分析投诉信息对应的投诉行为分析结果,并输出所述投诉行为分析结果。本发明通过客户投诉行为分析模型动态地将当前的投诉情况与历史的投诉情况联系起来,可以从大数据的角度对客户投诉进行实时分析,提升了判定客户投诉行为的的准确率。

著录项

  • 公开/公告号CN112633904A

    专利类型发明专利

  • 公开/公告日2021-04-09

    原文格式PDF

  • 申请/专利权人 中国平安财产保险股份有限公司;

    申请/专利号CN202011644103.3

  • 申请日2020-12-30

  • 分类号G06Q30/00(20120101);G06Q40/08(20120101);G06F40/242(20200101);G06F40/279(20200101);G06K9/62(20060101);G06F3/0481(20130101);G06F3/0484(20130101);

  • 代理机构44287 深圳市世纪恒程知识产权代理事务所;

  • 代理人魏润洁

  • 地址 518000 广东省深圳市福田区益田路5033号平安金融中心12、13、38、39、40层

  • 入库时间 2023-06-19 10:32:14

说明书

技术领域

本发明涉及保险业务领域,尤其涉及一种投诉行为分析方法、装置、设备及计算机可读存储介质。

背景技术

在保险行业遇到客户投诉是无可避免的事情,尤其是对于规模体量较大的保险公司,其经营的险种险类太多,客户很容易因未能准确理解投保过程、具体保险责任或者不满意其他服务而进行投诉。

现有的客户投诉基本是客户通过拨打保险公司的投诉热线或通过保险公司的投保系统中的投诉通道进行投诉,保险公司处理这些投诉的方法目前大部分是针对单次的投诉行为进行电话回访,逐一处理客户投诉。但是,这种单次逐一的处理方式无法动态地将各个投诉情况联系起来,更无法从大数据的角度对客户投诉进行实时分析。事实上,客户的投诉行为是有模式的,例如在某个新险投入市场的初期,极有可能因为销售坐席对于该险的个人理解不足而误导客户,进而引发投诉行为,容易对客户的投诉行为发生误判。例如某个险种的规定文档书写有误,从而导致该险种的客户投诉行为激增。

上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。

发明内容

本发明的主要目的在于提供一种投诉行为分析方法、装置、设备及计算机可读存储介质,旨在解决现有的投诉处理方式容易对客户的投诉行为发生误判的技术问题。

为实现上述目的,本发明提供一种投诉行为分析方法,所述投诉行为分析方法包括以下步骤:

实时监测话务平台的投诉热线或投保系统的投诉通道,以从所述投诉热线或所述投诉通道中获取实时的动态客户投诉信息流;

基于预设的滑动窗口以及滑动间隔,获取在所述滑动窗口对应的时间内的动态客户投诉信息流,得到待分析投诉信息;

在所述待分析投诉信息满足预设数量条件时,将所述待分析投诉信息输入至客户投诉行为分析模型进行分析,得到所述待分析投诉信息对应的投诉行为分析结果,并输出所述投诉行为分析结果。

可选地,所述基于预设的滑动窗口以及滑动间隔,获取在所述滑动窗口对应的时间内的动态客户投诉信息流,得到待分析投诉信息的步骤包括:

基于批处理间隔,将所述动态客户投诉信息流打包成若干批次的批数据,以使所述批数据进入批队列中排队等待被处理;

基于预设的滑动窗口以及滑动间隔,获取在所述滑动窗口对应的时间内的批数据,得到待分析投诉信息。

可选地,所述基于批处理间隔,将所述动态客户投诉信息流打包成若干批次的批数据,以使所述批数据进入批队列中排队等待被处理的步骤包括:

根据块间隔,将所述动态客户投诉信息流划分成与所述块间隔相匹配的客户投诉数据块;

根据批处理间隔,将所述客户投诉数据块打包成若干批次的批数据,以使所述批数据进入批队列中排队等待被处理。

可选地,所述在所述待分析投诉信息满足预设数量条件时,对所述待分析投诉信息依次执行分词操作以及词频分析操作,得到所述待分析投诉信息对应的投诉行为分析结果的步骤之前,还包括:

若所述滑动窗口对应的投诉事件的数量大于预设阈值,则判定所述待分析投诉信息满足预设数量条件。

可选地,所述在所述待分析投诉信息满足预设数量条件时,对所述待分析投诉信息依次执行分词操作以及词频分析操作,得到所述待分析投诉信息对应的投诉行为分析结果的步骤包括:

在所述待分析投诉信息满足预设数量条件时,将所述待分析投诉信息输入至客户投诉行为分析模型中的分词子模型,以对所述待分析投诉信息执行分词操作,得到所述待分析投诉信息对应的第一预处理信息;

将所述待分析投诉信息对应的第一预处理信息输入至所述客户投诉行为分析模型中的文本词袋子模型,以对所述第一预处理信息执行词频分析操作,确定所述待分析投诉信息对应的投诉行为分析结果。

可选地,所述将所述待分析投诉信息对应的第一预处理信息输入至所述客户投诉行为分析模型中的文本词袋子模型,以对所述第一预处理信息执行词频分析操作,确定所述待分析投诉信息对应的投诉行为分析结果的步骤包括:

将所述待分析投诉信息对应的第一预处理信息输入至所述客户投诉行为分析模型中的文本词袋子模型;

基于停用词词典,除去所述第一预处理信息中的停用词,得到第二预处理信息;

基于文本词袋子模型对应的模型参数,以对所述第一预处理信息执行词频分析操作,确定所述待分析投诉信息对应的投诉行为分析结果,其中,所述投诉行为分析结果包括所述第二预处理信息中各个词语的词频和权重。

可选地,所述在所述待分析投诉信息满足预设数量条件时,将所述待分析投诉信息输入至客户投诉行为分析模型中的分词子模型,以对所述待分析投诉信息执行分词操作,得到所述待分析投诉信息对应的第一预处理信息的步骤之前,还包括:

获取标注数据集,其中,所述标注数据集为具有分隔标识和词性标识的训练文本,在训练所述分词子模型之前依次根据所述分割标识对所述标注数据集中各个词语进行分割以及根据所述词性标识对所述标注数据集中各个词语进行标识;

基于所述标注数据集对预设的深度学习模型进行训练,得到训练完成后对应的分词子模型。

此外,为实现上述目的,本发明还提供一种投诉行为分析装置,所述投诉行为分析装置包括:

监测模块,用于实时监测话务平台的投诉热线或投保系统的投诉通道,以从所述投诉热线或所述投诉通道中获取实时的动态客户投诉信息流;

获取模块,用于基于预设的滑动窗口以及滑动间隔,获取在所述滑动窗口对应的时间内的动态客户投诉信息流,得到待分析投诉信息;

分析模块,用于在所述待分析投诉信息满足预设数量条件时,对所述待分析投诉信息依次执行分词操作以及词频分析操作,得到所述待分析投诉信息对应的投诉行为分析结果,并输出所述投诉行为分析结果。

此外,为实现上述目的,本发明还提供一种投诉行为分析设备,所述投诉行为分析设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的投诉行为分析程序,所述投诉行为分析程序被所述处理器执行时实现如上述的投诉行为分析方法的步骤。

此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有投诉行为分析程序,所述投诉行为分析程序被处理器执行时实现如上述的投诉行为分析方法的步骤。

本实施例提出的投诉行为分析方法,通过检测话务平台的投诉热线或投保系统的投诉通道,以获取实时的动态客户投诉信息流;之后,以滑动间隔为获取动态客户投诉信息流的时间间隔,获取在滑动窗口对应的时间内的动态客户投诉信息流,得到待分析投诉信息;若检测到在滑动窗口对应的时间内的动态客户投诉信息流满足一定的数量条件,则将待分析投诉信息输入至客户投诉行为分析模型,以对所述待分析投诉信息依次执行分词操作以及词频分析操作,得到待分析投诉信息对应的投诉行为分析结果,并输出投诉行为分析结果。通过上述步骤,可以对客户的实时投诉信息进行监控,在检测到客户的实时投诉信息在一段时间内达到一定的数量时,将在这段时间内的实时投诉信息对应的待分析投诉信息输入至客户投诉行为分析模型进行分析,以分析当前时段客户的投诉行为,得到对应的投诉行为分析结果,从而通过客户投诉行为分析模型动态地将当前的投诉情况与历史的投诉情况联系起来,可以从大数据的角度对客户投诉进行实时分析,提升了判定客户投诉行为的的准确率。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的投诉行为分析设备结构示意图;

图2为本发明投诉行为分析方法第一实施例的流程示意图;

图3为本发明投诉行为分析方法第二实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

如图1所示,图1是本发明实施例方案涉及的硬件运行环境的投诉行为分析设备结构示意图。

本发明实施例投诉行为分析设备可以是PC,也可以是智能手机、平板电脑、电子书阅读器、MP3(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)播放器、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、便携计算机等具有显示功能的可移动式终端设备。

如图1所示,该投诉行为分析设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

可选地,投诉行为分析设备还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示屏的亮度,接近传感器可在投诉行为分析设备移动到耳边时,关闭显示屏和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别投诉行为分析设备姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;当然,投诉行为分析设备还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。

本领域技术人员可以理解,图1中示出的投诉行为分析设备结构并不构成对投诉行为分析设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及投诉行为分析程序。

在图1所示的投诉行为分析设备中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的投诉行为分析程序。

在本实施例中,投诉行为分析设备包括:存储器1005、处理器1001及存储在所述存储器1005上并可在所述处理器1001上运行的投诉行为分析程序,其中,处理器1001调用存储器1005中存储的投诉行为分析程序时,并执行以下操作:

实时监测话务平台的投诉热线或投保系统的投诉通道,以从所述投诉热线或所述投诉通道中获取实时的动态客户投诉信息流;

基于预设的滑动窗口以及滑动间隔,获取在所述滑动窗口对应的时间内的动态客户投诉信息流,得到待分析投诉信息;

在所述待分析投诉信息满足预设数量条件时,对所述待分析投诉信息依次执行分词操作以及词频分析操作,得到所述待分析投诉信息对应的投诉行为分析结果,并输出所述投诉行为分析结果。

进一步地,处理器1001可以调用存储器1005中存储的投诉行为分析程序,还执行以下操作:

基于批处理间隔,将所述动态客户投诉信息流打包成若干批次的批数据,以使所述批数据进入批队列中排队等待被处理;

基于预设的滑动窗口以及滑动间隔,获取在所述滑动窗口对应的时间内的批数据,得到待分析投诉信息。

进一步地,处理器1001可以调用存储器1005中存储的投诉行为分析程序,还执行以下操作:

根据块间隔,将所述动态客户投诉信息流划分成与所述块间隔相匹配的客户投诉数据块;

根据批处理间隔,将所述客户投诉数据块打包成若干批次的批数据,以使所述批数据进入批队列中排队等待被处理。

进一步地,处理器1001可以调用存储器1005中存储的投诉行为分析程序,还执行以下操作:

若所述滑动窗口对应的投诉事件的数量大于预设阈值,则判定所述待分析投诉信息满足预设数量条件。

进一步地,处理器1001可以调用存储器1005中存储的投诉行为分析程序,还执行以下操作:

在所述待分析投诉信息满足预设数量条件时,将所述待分析投诉信息输入至客户投诉行为分析模型中的分词子模型,以对所述待分析投诉信息执行分词操作,得到所述待分析投诉信息对应的第一预处理信息;

将所述待分析投诉信息对应的第一预处理信息输入至所述客户投诉行为分析模型中的文本词袋子模型,以对所述第一预处理信息执行词频分析操作,确定所述待分析投诉信息对应的投诉行为分析结果。

进一步地,处理器1001可以调用存储器1005中存储的投诉行为分析程序,还执行以下操作:

将所述待分析投诉信息对应的第一预处理信息输入至所述客户投诉行为分析模型中的文本词袋子模型;

基于停用词词典,除去所述第一预处理信息中的停用词,得到第二预处理信息;

基于文本词袋子模型对应的模型参数,以对所述第一预处理信息执行词频分析操作,确定所述待分析投诉信息对应的投诉行为分析结果,其中,所述投诉行为分析结果包括所述第二预处理信息中各个词语的词频和权重。

进一步地,处理器1001可以调用存储器1005中存储的投诉行为分析程序,还执行以下操作:

获取标注数据集,其中,所述标注数据集为具有分隔标识和词性标识的训练文本,在训练所述分词子模型之前依次根据所述分割标识对所述标注数据集中各个词语进行分割以及根据所述词性标识对所述标注数据集中各个词语进行标识;

基于所述标注数据集对预设的深度学习模型进行训练,得到训练完成后对应的分词子模型。

本发明还提供一种投诉行为分析方法,参照图2,图2为本发明投诉行为分析方法第一实施例的流程示意图。

在本实施例中,该投诉行为分析方法包括以下步骤:

步骤S10,实时监测话务平台的投诉热线或投保系统的投诉通道,以从所述投诉热线或所述投诉通道中获取实时的动态客户投诉信息流;

本发明提出的投诉行为分析方法应用于保险领域,可以是应用于企业的保险业务,可以基于保险数据进行分析保险数据中客户的投诉行为模式。在本实施例中,投诉热线用于在保险业务话务平台上提供保险业务的投诉功能,投诉通道用于在保险业务投保系统上提供保险业务的投诉功能,客户可以通过拨打投诉热线或者进入投保系统对应的投诉通道进行投诉。本发明提出的投诉行为分析方法应用于一种系统架构,该系统架构实时对话务平台的投诉热线或投保系统的投诉通道进行监测,以监测话务平台的投诉热线或投保系统的投诉通道中的客户的实时投诉信息,在投诉热线或投诉通道中监测到客户的实时投诉信息后,从投诉热线或投诉通道中获取实时的动态客户投诉信息流。

进一步地,对于话务平台的投诉热线,可以在检测到投诉热线接入话务时,对接入话务执行语音识别操作,以识别接入话务的语音内容,得到投诉热线的实时投诉信息。对于投保系统的投诉通道,在投保系统的投诉通道接收到实时投诉信息时,直接从投诉通道中获取文本形式的实时投诉信息。在获取到投诉热线的实时投诉信息或者投诉通道中的实时投诉内容后,投诉热线的实时投诉信息或者投诉通道中的实时投诉信息按照时间顺序进入预设处理通道,以供实时获取动态客户投诉信息流,投诉热线的实时投诉信息以及投诉通道的实时投诉热线组成动态投诉信息流。进一步地,还可以将话务平台的投诉热线或投保系统的投诉通道中的客户的实时投诉信息存储至本地HBASE数据库以便离线需求使用。

步骤S20,基于预设的滑动窗口以及滑动间隔,获取在所述滑动窗口对应的时间内的动态客户投诉信息流,得到待分析投诉信息;

在本实施例中,投诉热线的实时投诉信息或者投诉通道中的实时投诉信息按照时间顺序进入预设处理通道,基于预设的滑动窗口以及滑动间隔,从预设处理通道中获取在滑动窗口对应的时间内的动态客户投诉信息流,并将在滑动窗口对应的动态客户投诉信息流作为待分析投诉信息。其中,滑动窗口规定了获取动态客户投诉信息流的长度,滑动间隔规定了获取动态客户投诉信息流的时间间隔,即,将滑动间隔作为获取动态客户投诉信息流的时间间隔,将滑动窗口作为获取动态客户投诉信息流的时间长度,周期性地获取一定长度的动态客户投诉信息流。

步骤S30,在所述待分析投诉信息满足预设数量条件时,对所述待分析投诉信息依次执行分词操作以及词频分析操作,得到所述待分析投诉信息对应的投诉行为分析结果,并输出所述投诉行为分析结果。

在本实施例中,对于每一个滑动窗口(以1小时为例)内收集到的待分析投诉信息,动态运行实时客户投诉行为分析模型,在检测到待分析投诉信息满足预设数量条件时运行实时客户投诉行为分析模型,将待分析投诉信息输入至该客户投诉行为分析模型,以供客户投诉行为分析模型对待分析投诉信息依次执行分词操作以及词频分析操作,具体地,该模型针对客户投诉的文本信息(待分析投诉信息)首先根据保险公司内部的保险专有名词词典进行分词处理,接着去除系统预设的停用词(例如“我”,“你”,“。”,“,”等),接着统计每个词语(短语)的词频以及计算各个词语的权重,最终得到待分析投诉信息的投诉行为分析结果,待分析投诉信息的投诉行为分析结果包括各个词语的词频和权重,最终根据词频输出投诉行为分析结果。进一步地,客户投诉行为分析模型设定词频阈值(以200次为例),如滑动窗口内某个词语(短语)的词频达到设定的词频阈值,则向用户体验部门发出动态警告,从而可以达到实时监测客户的投诉行为。

本实施例提出的投诉行为分析方法,通过检测话务平台的投诉热线或投保系统的投诉通道,以获取实时的动态客户投诉信息流;之后,以滑动间隔为获取动态客户投诉信息流的时间间隔,获取在滑动窗口对应的时间内的动态客户投诉信息流,得到待分析投诉信息;若检测到在滑动窗口对应的时间内的动态客户投诉信息流满足一定的数量条件,则将待分析投诉信息输入至客户投诉行为分析模型进行分析,得到待分析投诉信息对应的投诉行为分析结果,并输出投诉行为分析结果。通过上述步骤,可以对客户的实时投诉信息进行监控,在检测到客户的实时投诉信息在一段时间内达到一定的数量时,将在这段时间内的实时投诉信息对应的待分析投诉信息输入至客户投诉行为分析模型,以对所述待分析投诉信息依次执行分词操作以及词频分析操作,以分析当前时段客户的投诉行为,得到对应的投诉行为分析结果,从而通过客户投诉行为分析模型动态地将当前的投诉情况与历史的投诉情况联系起来,可以从大数据的角度对客户投诉进行实时分析,提升了判定客户投诉行为的的准确率。

基于第一实施例,提出本发明投诉行为分析方法的第二实施例,参照图3,在本实施例中,步骤S20包括:

步骤S21,基于批处理间隔,将所述动态客户投诉信息流打包成若干批次的批数据,以使所述批数据进入批队列中排队等待被处理;

步骤S22,基于预设的滑动窗口以及滑动间隔,获取在所述滑动窗口对应的时间内的批数据,得到待分析投诉信息。

在本实施例中,批处理间隔为每次处理动态客户投诉信息流的时间长度,即批处理间隔决定了每次处理动态客户投诉信息流的长度。在得到客户的实时投诉信息对应的动态客户投诉信息流之后,设置每次处理动态客户投诉信息流的时间长度为批处理间隔对应的时间,将动态客户投诉信息流打包成若干批次的批数据,以使批数据进入批队列中排队等待被处理。之后,基于预设的滑动窗口以及滑动间隔,从预设处理通道中获取在滑动窗口对应的时间内的批数据,并将在滑动窗口对应的批数据作为待分析投诉信息。

进一步地,对于滑动窗口(window length)和滑动间隔(sliding interval)大小的设置,应遵循为批处理间隔的整数倍的原则进行设置,即滑动窗口的时间长度为动态客户投诉信息流的批处理间隔对应时间长度的整数倍,滑动间隔的时间长度为动态客户投诉信息流的批处理间隔对应时间长度的整数倍,并根据实际应用场景对滑动窗口和滑动间隔进行调优。

进一步地,所述基于批处理间隔,将所述动态客户投诉信息流打包成若干批次的批数据,以使所述批数据进入批队列中排队等待被处理的步骤包括:

步骤S211,根据块间隔,将所述动态客户投诉信息流划分成与所述块间隔相匹配的客户投诉数据块;

步骤S212,根据批处理间隔,将所述客户投诉数据块打包成若干批次的批数据,以使所述批数据进入批队列中排队等待被处理。

在本实施例中,块间隔为将数据流(动态客户投诉信息流)划分成若干数据块的时间;若干数据块组合成一个批次的时间,即批处理间隔。即,通过块间隔将动态客户信息流划分成若干客户投诉数据块;预先进行设置批处理间隔,之后再按照批处理间隔,将客户投诉数据块打包成若干批次,各个批次的客户投诉数据块的数量相同。其中,批处理间隔与执行单元的数量相关。

针对动态数据流的动态客户投诉信息流接收进行并行调优,并设置合理的批处理间隔(batch interval)、块间隔(block interval)。例如,集群中每台计算机的CPU核心数为10,则设置批处理间隔为2s,块间隔为200ms,这样每个批数据对应的客户投诉数据块数量是2s/200ms=10个,以充分利用每个CPU核心,不损失计算性能。此外还需要监测每个批数据的处理时间,保证处理时间与批处理间隔基本保持一致,以保证应用的运行稳定性。

进一步地,所述在所述待分析投诉信息满足预设数量条件时,对所述待分析投诉信息依次执行分词操作以及词频分析操作,得到所述待分析投诉信息对应的投诉行为分析结果的步骤之前,还包括:若所述滑动窗口对应的投诉事件的数量大于预设阈值,则判定所述待分析投诉信息满足预设数量条件。

进一步地,所述在所述待分析投诉信息满足预设数量条件时,对所述待分析投诉信息依次执行分词操作以及词频分析操作,得到所述待分析投诉信息对应的投诉行为分析结果的步骤包括:

步骤S31,在所述待分析投诉信息满足预设数量条件时,将所述待分析投诉信息输入至客户投诉行为分析模型中的分词子模型,以对所述待分析投诉信息执行分词操作,得到所述待分析投诉信息对应的第一预处理信息;

步骤S32,将所述待分析投诉信息对应的第一预处理信息输入至所述客户投诉行为分析模型中的文本词袋子模型,以对所述第一预处理信息执行词频分析操作,确定所述待分析投诉信息对应的投诉行为分析结果。

在本实施例中,将待分析投诉信息输入至该客户投诉行为分析模型,以供客户投诉行为分析模型对待分析投诉信息进行分析。具体地,在待分析投诉信息满足预设数量条件时,将待分析投诉信息输入至客户投诉行为分析模型中的分词子模型,以对待分析投诉信息执行分词操作,得到待分析投诉信息对应的第一预处理信息,具体地,该分词子模型针对客户投诉的文本信息首先根据保险公司内部的保险专有名词词典进行分词处理,得到待分析投诉信息对应的第一预处理信息。之后,将待分析投诉信息对应的第一预处理信息输入至客户投诉行为分析模型中的文本词袋子模型,接着根据客户投诉行为分析模型中的文本词袋子模型统计第一预处理信息中每个词语的词频以及权重,最终得到待分析投诉信息的投诉行为分析结果,待分析投诉信息的投诉行为分析结果包括预处理信息中每个词语的词频和权重,最终根据词频输出关键词。

进一步地,所述将所述待分析投诉信息对应的第一预处理信息输入至所述客户投诉行为分析模型中的文本词袋子模型,以对所述第一预处理信息执行词频分析操作,确定所述待分析投诉信息对应的投诉行为分析结果的步骤包括:

步骤S321,将所述待分析投诉信息对应的第一预处理信息输入至所述客户投诉行为分析模型中的文本词袋子模型;

步骤S322,基于停用词词典,除去所述第一预处理信息中的停用词,得到第二预处理信息;

步骤S323,基于文本词袋子模型对应的模型参数,对所述第一预处理信息执行词频分析操作,确定所述待分析投诉信息对应的投诉行为分析结果,其中,所述投诉行为分析结果包括所述第二预处理信息中各个词语的词频和权重。

在本实施例中,将待分析投诉信息对应的第一预处理信息输入至客户投诉行为分析模型中的文本词袋子模型;输入第一预处理信息至客户投诉行为分析模型后,文本词袋子模型根据停用词词典,除去第一预处理信息中的停用词,得到第二预处理信息,之后文本词袋子模型根据文本词袋子模型的模型参数和第二预处理信息,以模型参数为权重,对第二预处理信息进行加权求和,统计第二预处理信息中每个词语的词频以及权重,最终得到待分析投诉信息的投诉行为分析结果,待分析投诉信息的投诉行为分析结果包括第二预处理信息中每个词语的词频和权重,最终根据词频输出关键词。

进一步地,所述在所述待分析投诉信息满足预设数量条件时,将所述待分析投诉信息输入至客户投诉行为分析模型中的分词子模型,以对所述待分析投诉信息执行分词操作,得到所述待分析投诉信息对应的第一预处理信息的步骤之前,还包括:

步骤S33,获取标注数据集,其中,所述标注数据集为具有分隔标识和词性标识的训练文本,在训练所述分词子模型之前依次根据所述分割标识对所述标注数据集中各个词语进行分割以及根据所述词性标识对所述标注数据集中各个词语进行标识;

步骤S34,基于所述标注数据集对预设的深度学习模型进行训练,得到训练完成后对应的分词子模型。

在本实施例中,在基于客户投诉行为分析模型中的分词子模型进行分析之前,先构建分词子模型。具体地,训练文本被分隔标识和词性标识标注后得到标注数据集,并获取标注数据集以基于标注数据集中的已标注文本构建分词子模型,其中,标注数据集为具有分隔标识和词性标识的训练文本,在训练分词子模型之前先根据分割标识对训练文本中各个词语进行分割,分割训练文本中的各个词语后再根据词性标识对训练文本中各个词语进行标识,以对训练文本中分割好的词语进行词性标识。得到标注数据集之后,基于标注数据集对预设的深度学习模型进行训练,得到训练完成后对应的分词子模型。

本实施例提出的投诉行为分析方法,通过设置每次处理动态客户投诉信息流的时间长度为批处理间隔对应的时间,将动态客户投诉信息流打包成若干批次的批数据,以使批数据进入批队列中排队等待被处理,这种流数据的数据处理方式有效地减少数据的丢失以及可以提升数据处理的效率,有利于后续获取实时投诉信息对应的批数据进行分析,以分析当前时段客户的投诉行为,得到对应的投诉行为分析结果。

此外,本发明实施例还提出一种投诉行为分析装置,该投诉行为分析装置包括:

监测模块,用于实时监测话务平台的投诉热线或投保系统的投诉通道,以从所述投诉热线或所述投诉通道中获取实时的动态客户投诉信息流;

获取模块,用于基于预设的滑动窗口以及滑动间隔,获取在所述滑动窗口对应的时间内的动态客户投诉信息流,得到待分析投诉信息;

分析模块,用于在所述待分析投诉信息满足预设数量条件时,对所述待分析投诉信息依次执行分词操作以及词频分析操作,得到所述待分析投诉信息对应的投诉行为分析结果,并输出所述投诉行为分析结果。

进一步地,所述获取模块,还用于:

基于批处理间隔,将所述动态客户投诉信息流打包成若干批次的批数据,以使所述批数据进入批队列中排队等待被处理;

基于预设的滑动窗口以及滑动间隔,获取在所述滑动窗口对应的时间内的批数据,得到待分析投诉信息。

进一步地,所述获取模块,还用于:

根据块间隔,将所述动态客户投诉信息流划分成与所述块间隔相匹配的客户投诉数据块;

根据批处理间隔,将所述客户投诉数据块打包成若干批次的批数据,以使所述批数据进入批队列中排队等待被处理。

进一步地,所述获取模块,还用于:

若所述滑动窗口对应的投诉事件的数量大于预设阈值,则判定所述待分析投诉信息满足预设数量条件。

进一步地,所述分析模块,还用于:

在所述待分析投诉信息满足预设数量条件时,将所述待分析投诉信息输入至客户投诉行为分析模型中的分词子模型,以对所述待分析投诉信息执行分词操作,得到所述待分析投诉信息对应的第一预处理信息;

将所述待分析投诉信息对应的第一预处理信息输入至所述客户投诉行为分析模型中的文本词袋子模型,以对所述第一预处理信息执行词频分析操作,确定所述待分析投诉信息对应的投诉行为分析结果。

进一步地,所述分析模块,还用于:

将所述待分析投诉信息对应的第一预处理信息输入至所述客户投诉行为分析模型中的文本词袋子模型;

基于停用词词典,除去所述第一预处理信息中的停用词,得到第二预处理信息;

基于文本词袋子模型对应的模型参数,对所述第一预处理信息执行词频分析操作,确定所述待分析投诉信息对应的投诉行为分析结果,其中,所述投诉行为分析结果包括所述第二预处理信息中各个词语的词频和权重。

进一步地,所述分析模块,还用于:

获取标注数据集,其中,所述标注数据集为具有分隔标识和词性标识的训练文本,在训练所述分词子模型之前依次根据所述分割标识对所述标注数据集中各个词语进行分割以及根据所述词性标识对所述标注数据集中各个词语进行标识;

基于所述标注数据集对预设的深度学习模型进行训练,得到训练完成后对应的分词子模型。

此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有投诉行为分析程序,所述投诉行为分析程序被处理器执行时实现如上述中任一项所述的投诉行为分析方法的步骤。

本发明计算机可读存储介质具体实施例与上述投诉行为分析方法的各实施例基本相同,在此不再详细赘述。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号