首页> 中国专利> 恶意占座订单的识别方法、装置及电子设备

恶意占座订单的识别方法、装置及电子设备

摘要

本申请公开了一种恶意占座订单的识别方法、装置及电子设备。该识别方法包括:当接收到票务订单时,获取下单人在当前时刻之前的第一时间段内的航班查询数据,获取该票务订单的订单数据;根据航班查询数据和订单数据确定特征数据;将特征数据输入预先完成训练的恶意行为识别模型,得到恶意行为识别模型对特征数据处理后输出的恶意占座概率;如果恶意占座概率大于预设的概率阈值,则确定该票务订单为恶意占座订单。本申请公开的技术方案,基于多个维度的特征值以及预先完成训练的恶意行为识别模型,能够准确地识别票务订单是否为恶意占座订单,从而使得航空公司可以对恶意占座订单进行处理,缓解恶意占座的问题。

著录项

  • 公开/公告号CN112163932A

    专利类型发明专利

  • 公开/公告日2021-01-01

    原文格式PDF

  • 申请/专利权人 中国民航信息网络股份有限公司;

    申请/专利号CN202011059772.4

  • 发明设计人 刘斌;姚一;周中雨;李洋;

    申请日2020-09-30

  • 分类号G06Q30/06(20120101);G06Q10/02(20120101);G06Q50/30(20120101);G06F16/9537(20190101);G06N20/00(20190101);

  • 代理机构11227 北京集佳知识产权代理有限公司;

  • 代理人王娇娇

  • 地址 100085 北京市顺义区后沙峪镇裕民大街7号

  • 入库时间 2023-06-19 09:24:30

说明书

技术领域

本申请属于数据处理技术领域,尤其涉及一种恶意占座订单的识别方法、装置及电子设备。

背景技术

随着经济的发展和人们生活水平的提高,飞机已经成为基本交通方式之一。机票预订的快捷性是影响民航服务质量的一个重要因素。当前机票销售渠道主要有直销和分销两种。分销即为代理制,航空公司通过代理商将机票销售给旅客;直销是航空公司通过自己的网站直接向旅客销售机票。机票分销模式带来严重的恶意占座问题。恶意占座是指:用户在机票销售系统中抢先下单,但不支付订单的行为。恶意占座导致航班的座位被占,短时间内无法销售,降低了正常用户的购票体验,而且也容易造成被占用的座位最终未售出。

目前针对恶意占座的问题,采用的处理方案主要为:在订票之前增加验证环节。例如,用户需要在订票之前输入验证码,或者需要进行手机验证。但是,这会影响正常用户的购票体验,而且恶意用户可以通过机器识别验证码,利用虚假的手机号和短信接收器完成手机验证,不能很好的解决恶意占座的问题。

因此,如何缓解机票预定过程中的恶意占座问题,是本领域技术人员亟待解决的问题。

发明内容

有鉴于此,本申请的目的在于提供一种恶意占座订单的识别方法、装置及电子设备,能够准确地识别票务订单是否为恶意占座订单,从而对恶意占座订单进行处理,缓解恶意占座的问题。

为实现上述目的,本申请提供如下技术方案:

本申请提供一种恶意占座订单的识别方法,包括:

当接收到票务订单时,获取下单人在当前时刻之前的第一时间段内的航班查询数据,获取所述票务订单的订单数据;

根据所述航班查询数据和所述订单数据确定特征数据,所述特征数据包括:第一特征值,用于指示所述票务订单为所述下单人在所述第一时间段内的第几次下单;第二特征值,用于指示所述下单人最近一次查询航班的时间;第三特征值,用于指示所述票务订单的下单时间与所述下单人最近一次查询航班的时间之间的时间间隔;第四特征值,用于指示所述下单人最近一次查询航班的时间与前一次查询航班的时间之间的时间间隔;第五特征值,用于指示所述下单人在所述票务订单的下单时间之前的第二时间段内查询航班的次数;第六特征值,用于指示所述下单人的最近一次查询地点重合度;第七特征值,用于指示所述下单人最近一次查询航班为所述第一时间段内的第几次查询;第八特征值,用于指示所述下单人在所述第一时间段内是否查询过所述票务订单中的航班;

将所述特征数据输入预先完成训练的恶意行为识别模型,得到所述恶意行为识别模型对所述特征数据处理后输出的恶意占座概率;

如果所述恶意占座概率大于预设的概率阈值,则确定所述票务订单为恶意占座订单。

由此可见,本申请的有益效果为:

本申请实施例提供的恶意占座订单的识别方法,在接收到票务订单时,获取该票务订单的下单人在下单时刻之前的第一时间段内的航班查询数据、以及该票务订单的订单数据,之后基于航班查询数据和订单数据确定特征数据,其中,特征数据包括多个维度的特征值,之后将特征数据输入预先完成训练的恶意行为识别模型,由恶意行为识别模型对输入的特征数据进行处理,输出该票务订单的恶意占座概率,如果该票务订单的恶意占座概率大于预设的概率阈值,则确定该票务订单为恶意占座订单。基于本申请实施例提供的恶意占座订单的识别方法,在接收到票务订单时,将下单人在下单之前的一段时间内的航班查询数据,以及该票务订单的订单数据作为依据,从中获取多个维度的特征值,基于多个维度的特征值以及预先完成训练的恶意行为识别模型,能够准确地识别该票务订单是否为恶意占座订单,从而使得航空公司可以对恶意占座订单进行处理,缓解恶意占座的问题。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请一个实施例提供的恶意占座订单的识别方法的流程图;

图2为本申请另一个实施例提供的恶意行为识别模型的训练方法的流程图;

图3为本申请另一个实施例提供的恶意占座订单的识别装置的结构示意图;

图4为本申请另一个实施例提供的电子设备的结构示意图;

图5为本申请另一个实施例提供的flightshopping数据的示意图;

图6为本申请另一个实施例提供的sellseat数据的示意图。

具体实施方式

本申请实施例提供一种恶意占座订单的识别方法及装置,能够准确地识别票务订单是否为恶意占座订单,从而对恶意占座订单进行处理,缓解恶意占座的问题。

下面对本申请实施例中出现的技术术语进行说明:

IBE:电子商务支撑平台;

flightshopping:航班查询;

sellseat:航班预定;

etdz:预定座位出票;

kafka:一种分布式的消息分发系统;

redis:一种key-value型的数据库;

xgboost:一种机器学习算法;

SVM:一种机器学习算法。

下面将参照附图更详细地描述本申请的实施例。虽然附图中显示了本申请的某些实施例,然而应当理解的是,本申请可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本申请。应当理解的是,本申请的附图及实施例仅用于示例性作用,并非用于限制本申请的保护范围。

本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。

需要注意,本申请中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。

需要注意,本申请中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。

参见图1,图1为本申请一个实施例提供的恶意占座订单的识别方法的流程图。该方法的执行主体为电子设备,如服务器或者服务器集群。该识别方法包括:

S101:当接收到票务订单时,获取下单人在当前时刻(即该票务订单的下单时刻,也可以称为订票时刻)之前的第一时间段内的航班查询数据,获取票务订单的订单数据。

经过大量的数据统计分析发现:正常用户的订票行为和在订票之前的查询航班行为存在很大的关系。正常用户通常先查询自己关心的航班,当查询到合适的航班就会进行订票和出票的操作。而恶意用户(例如黄牛)是漫无目的地查询航班,或者仅局限在热门的航线上进行大量的查询,在订票阶段,恶意用户会多次对某些航段的航班进行预订。与正常用户相比,恶意用户无论是从查询量、订票量、查询航班的起飞到达城市对、订票航班的起飞达到城市对的分布上都是不同的。

因此,本申请实施例中,在接收到票务订单时,将下单人在下单之前的一段时间内的航班查询数据,以及该票务订单的订单数据作为依据,确定该票务订单是否为恶意占座订单。

在一个可能的实现方式中,航班查询数据包括:下单人查询航班的时间、以及下单人查询航班的起飞-到达城市对。订单数据包括:票务订单的下单时间、以及票务订单中航班的起飞-到达城市对。

在另一个可能的实现方式中,航班查询数据还可以包括:下单人是否正确获得查询结果的标识。订单数据还可以包括:该票务订单中航班的出发时间、订座是否成功的标识。

S102:根据航班查询数据和订单数据确定特征数据。

其中,特征数据包括:

第一特征值,用于指示票务订单为下单人在第一时间段内的第几次下单;第二特征值,用于指示下单人最近一次查询航班的时间;第三特征值,用于指示票务订单的下单时间与下单人最近一次查询航班的时间之间的时间间隔;第四特征值,用于指示下单人最近一次查询航班的时间与前一次查询航班的时间之间的时间间隔;第五特征值,用于指示下单人在票务订单的下单时间之前的第二时间段内查询航班的次数;第六特征值,用于指示下单人的最近一次查询地点重合度;第七特征值,用于指示下单人最近一次查询航班为第一时间段内的第几次查询;第八特征值,用于指示下单人在第一时间段内是否查询过票务订单中的航班。

这里对查询地点重合度进行说明:查询地点重合度是指下单人的票务订单中的城市对在之前查询过的航班中的城市对的匹配程度。例如,下单人之前查询过的城市有北京,上海,成都,广州,而下单人下单的票务订单中的城市对是北京和上海,则会算出一个重合度数值,如果下单人下单的票务订单中的城市对是北京和南京,则同样也会算出一个重合度数值。

这里结合实例对各个特征值进行说明。

当接收到票务订单时,获取下单人在从当日零点到当前时刻(即该票务订单的下单时刻)之间的航班查询数据,获取该票务订单的订单数据。

也就是说,该第一时间段可以配置为:从当日零点到票务订单的下单时刻之间的时间段。

当然,第一时间段并不限定于此。例如,该第一时间段可以配置为:票务订单的下单时刻之前的数个小时(如2个小时)。

确定该票务订单为同一下单人在今天的第几次下单,据此生成第一特征值。确定该票务订单的下单人最近一次查询航班的时间,据此生成第二特征值。确定该票务订单的下单时间与下单人最近一次查询航班的时间之间的时间间隔,据此生成第三特征值。确定该票务订单的下单人最近一次查询航班的时间与前一次查询航班的时间之间的时间间隔,也就是确定该票务订单的下单人最近两次查询航班的时间间隔,据此生成第四特征值。确定该票务订单的下单人在下单之前的第二时间段(例如5秒)内查询航班的次数,据此生成第五特征值。确定下单人的最近一次查询地点重合度,据此生成第六特征值。确定下单人最近一次查询航班为今天第几次查询,据此生成第七特征值。确定用户在今天是否查询过该票务订单中的航班,据此生成第八特征值。

可以看到,上述的特征信息包括了多个维度的特征值,能够更加全面地衡量用户的订票行为是否为恶意占座行为。

S103:将特征数据输入预先完成训练的恶意行为识别模型,得到恶意行为识别模型对特征数据处理后输出的恶意占座概率。

其中,恶意行为识别模型是经过大量的训练样本训练得到的,每个训练样本基于一个历史票务订单生成,并且每个训练样本具有标注信息,该标注信息指示生成该训练样本的历史票务订单是否为恶意占座订单。恶意行为识别模型具备将票务订单的预测结果趋于实际情况的能力。

S104:如果恶意占座概率大于预设的概率阈值,则确定票务订单为恶意占座订单。

恶意行为识别模型对输入的特征数据进行处理,输出恶意占座概率。如果该恶意占座概率大于预设的概率阈值,则确定该票务订单为恶意订单。之后,可以将该票务订单标记为恶意占座订单,由航空公司对该票务订单进行处理。航空公司对恶意占座订单的处理包括但不限于取消该票务订单。

本申请实施例提供的恶意占座订单的识别方法,在接收到票务订单时,获取该票务订单的下单人在下单时刻之前的第一时间段内的航班查询数据、以及该票务订单的订单数据,之后基于航班查询数据和订单数据确定特征数据,其中,特征数据包括多个维度的特征值,之后将特征数据输入预先完成训练的恶意行为识别模型,由恶意行为识别模型对输入的特征数据进行处理,输出该票务订单的恶意占座概率,如果该票务订单的恶意占座概率大于预设的概率阈值,则确定该票务订单为恶意占座订单。基于本申请实施例提供的恶意占座订单的识别方法,在接收到票务订单时,将下单人在下单之前的一段时间内的航班查询数据,以及该票务订单的订单数据作为依据,从中获取多个维度的特征值,基于多个维度的特征值以及预先完成训练的恶意行为识别模型,能够准确地识别该票务订单是否为恶意占座订单,从而使得航空公司可以对恶意占座订单进行处理,缓解恶意占座的问题。

在一个实施例中,获取下单人在当前时刻之前的第一时间段内的航班查询数据,获取票务订单的订单数据,包括:

从消息分发系统获取全渠道数据;对全渠道数据进行解析,获取下单人在当前时刻之前的第一时间段内的航班查询数据、以及票务订单的订单数据。

下面进行详细说明:

机票销售系统(例如IBE)将用户查询航班和订票过程中产生的全渠道数据发送到消息分发系统(如kafka)。

从消息分发系统获取全渠道数据后,对全渠道数据中的flightshopping数据和sellseat数据进行解析。具体的,从flightshopping数据中解析出查询航班的用户的IP地址、查询航班的时间、查询航班的起飞-到达城市对,并计算查询航班的时间距离当天零点的时间(可以以秒为单位),之后将查询航班的起飞-到达城市对,以及查询航班的时间距离当天零点的时间存入字典中,以用户的IP地址和航班查询的日期(如某月某日)作为key,将上述字典作为value存入数据库(如Redis)。在获取到票务订单的sellseat数据后,解析出该票务订单的下单人的IP地址、该票务订单的发生时间(也就是下单时间)、该票务订单中航班的起飞-到达城市对,以下单人的IP地址和该票务订单的发生日期(如某月某日)作为key,在数据中搜索该key对应的value,从而得到航班查询数据。

下面对本申请实施例中所使用恶意行为识别模型的训练过程进行说明。

参见图2,图2为本申请另一个实施例提供的恶意行为识别模型的训练方法的流程图。该训练方法包括:

S201:获得多个训练样本。

其中,一个训练样本基于一个样本票务订单生成。每个训练样本均具有标注信息,标注信息用于指示样本票务订单是否为恶意占座订单。具体的,出票的样本票务订单确定为正常订单,未出票的样本票务订单确定为恶意占座订单。

可以理解的是,基于正常订单生成的训练样本为正样本,基于恶意占座订单生成的训练样本为负样本。也就是说,对学习模型进行训练所使用的多个训练样本包括正样本和负样本,这使得学习模型能够更好的学习正常订单和恶意占座订单之间的差异,从而提高预测结果的准确度。

每个训练样本为样本票务订单的特征数据,包括:

第一特征值,用于指示样本票务订单为下单人在第一时间段(位于样本票务订单的下单时间之前)内的第几次下单;第二特征值,用于指示样本票务订单的下单人最近一次查询航班的时间;第三特征值,用于指示样本票务订单的下单时间与样本票务订单的下单人最近一次查询航班的时间之间的时间间隔;第四特征值,用于指示样本票务订单的下单人最近一次查询航班的时间与前一次查询航班的时间之间的时间间隔;第五特征值,用于指示样本票务订单的下单人在样本票务订单的下单时间之前的第二时间段内查询航班的次数;第六特征值,用于指示样本票务订单的下单人的最近一次查询地点重合度;第七特征值,用于指示样本票务订单的下单人最近一次查询航班为第一时间段内的第几次查询;第八特征值,用于指示样本票务订单的下单人在第一时间段内是否查询过样本票务订单中的航班。

S202:利用预先构建的学习模型对训练样本进行预测,获得预测结果。

该预测结果为训练样本的恶意占座概率。

S203:根据预测结果和标注信息调整学习模型,直至调整后的学习模型满足预设收敛条件,将满足预设收敛条件的学习模型确定为恶意行为识别模型。

预先构建的学习模型的初始模型参数均为自定义数值,训练学习模型的过程就是优化模型参数,以使得学习模型逐渐收敛,且预测结果的准确率逐渐提高的过程。当学习模型满足预设收敛条件时,将当前的学习模型确定为恶意行为识别模型。

在一个实施例中,预设收敛条件为:学习模型的识别正确率达到预设数值。

在另一个实施例中,预设收敛条件为:学习模型的识别正确率不再上升。

在一个实施例中,采用如下方式生成训练样本:

1)、获得样本票务订单的下单人在下单时刻之前的第一时间段内的航班查询数据,获得样本票务订单的订单数据。

在一个可能的实现方式中,航班查询数据包括:样本票务订单的下单人查询航班的时间、以及样本票务订单的下单人查询航班的起飞-到达城市对。订单数据包括:样本票务订单的下单时间、以及样本票务订单中航班的起飞-到达城市对。

在另一个可能的实现方式中,航班查询数据还可以包括:样本票务订单的下单人是否正确获得查询结果的标识。订单数据还可以包括:该样本票务订单中航班的出发时间、订座是否成功的标识。

2)、根据样本票务订单的下单人在下单时刻之前的第一时间段内的航班查询数据、以及样本票务订单的订单数据,确定样本票务订单的特征数据,将样本票务订单的特征数据作为一个训练样本。

其中,样本票务订单的特征数据如前文的说明。

3)、获取样本票务订单的出票信息。

4)、根据样本票务订单的出票信息对训练样本进行标注。

例如,如果样本票务订单已出票,则确定该样本票务订单为正常订单,其标注信息为1;如果样本票务订单未出票,则确定该样本票务订单为恶意占座订单,其标注信息为0。

在一个实施例中,获得样本票务订单的下单人在下单时刻之前的第一时间段内的航班查询数据,获得样本票务订单的订单数据,包括:

获得生产日志;

对生产日志进行解析,获取样本票务订单的下单人的全渠道信息;

对样本票务订单的下单人的全渠道信息进行解析,获取样本票务订单的下单人在下单时刻之前的第一时间段内的航班查询数据、以及样本票务订单的订单数据。

用户信息采集组件采集用户在航空公司网站和其他购票APP上查询航班、浏览信息和预定座位等操作,将用户的IP地址和前述操作产生的数据记录在生产日志中。实施中,生产日志可以存储于机票销售系统,如IBE。

在对学习模型进行训练的过程中,获得生产日志,对该生产日志进行解析,获得样本票务订单的下单人的全渠道信息,之后,对样本票务订单的下单人的全渠道信息进行解析,获取样本票务订单的下单人在下单时刻之前的第一时间段内的航班查询数据、以及样本票务订单的订单数据。

下面进行具体说明:

从生产日志中获取全渠道数据,与通过消息分发系统获取全渠道数据相比,可以视为一种离线模式。

除了获取样本票务订单的下单人在下单时刻之前的第一时间段内的航班查询数据、以及样本票务订单的订单数据之外,还需要获取样本票务订单的出票信息。例如:从生产日志中解析出出票ETDZ的相关数据,通过PNR号将订票sellseat数据和出票ETDZ数据联合取来,就可以确定每一个样本票务订单之后是否继续进行了出票的操作,出票的正例,不出票的为负例。

在离线模式中,数据的需求量至少是连续的一周以上,从订票sellseat数据和出票ETDZ数据中,选取一定数量的出票正例和不出票负例,组成训练模型时的全部订票数据。由于离线模式下的查询flightshopping数据可以一次全部获取到,故不用再将查询flightshopping数据存进数据库中,将查询flightshopping数据按照与实时预测模式相同的格式保存成JSON格式文件;从订票数据集中每取出一条用户的订票数据,就去查询该用户在当前时刻到当天凌晨之间的所有查询flightshopping数据,结合订票数据和查询数据综合计算每一个用户订票时的8个特征值,并从出票ETDZ中获取到当前用户这次订票是否出票的结果,累计循环处理所选出来的每一条订座数据,得到一个所有订座用户的特征值文件。将这些特征值文件经过xgboost机器学习训练,得到一个训练后的模型,并根据测试数据测试之后的结果针对模型的参数进行优化,最终得到一个满意的恶意行为识别模型。

这里结合一个实例对生成训练样本的方案进行说明。

flightshopping数据如图5所示,sellseat数据如图6所示。对图5所示flightshopping数据和图6所示sellseat数据进行处理和计算,分别得到图6中每一个票务订单的特征数据(包括8个特征值)。

以图6中的第一个票务订单为例:

结合图5所示的flightshopping数据,确定该票务订单为下单人在第一时间段内(如当天)的第几次下单,确定该票务订单的下单人最近一次查询航班的时间,确定该票务订单的下单时间与该票务订单的下单人最近一次查询航班的时间之间的时间间隔,确定该票务订单的下单人最近一次查询航班的时间与前一次查询航班的时间之间的时间间隔,确定该票务订单的下单人在该票务订单的下单时间之前的第二时间段内(如5秒)查询航班的次数,确定该票务订单的下单人的最近一次查询地点重合度,确定该票务订单的下单人最近一次查询航班为第一时间段内的第几次查询,确定该票务订单的下单人在第一时间段内是否查询过样本票务订单中的航班。

图6中第一个票务订单的8个特征值为:

1,23,13,20,0,0.0769230769231,19,1。

由于采用了有监督的机器学习模型,因此,需要针对每个样本数据进行标注。ETDZ数据中包含每个票务订单最终是否出票的记录,将出票记录为1,未出票记录为0。该将标识位放置于票务订单的8个特征值的末尾,则图6中第一个票务订单的特征数据和标注信息为:

1,23,13,20,0,0.0769230769231,19,1,1。

在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。

应当理解,本申请的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本申请的范围在此方面不受限制。

本申请实施例上述公开了恶意占座订单的识别方法,相应的,本申请实施例还公开恶意占座订单的识别装置。

参见图3,图3为本申请另一个实施例提供过的恶意占座订单的识别装置的结构示意图。该装置应用于电子设备中,如服务器或者服务器集群等。该识别装置包括数据获取单元100、特征数据获取单元200、预测单元300和识别单元400。

其中:

数据获取单元100,用于当接收到票务订单时,获取下单人在当前时刻之前的第一时间段内的航班查询数据,获取票务订单的订单数据。

特征数据获取单元200,用于根据航班查询数据和订单数据确定特征数据。

其中,特征数据包括:第一特征值,用于指示票务订单为下单人在第一时间段内的第几次下单;第二特征值,用于指示下单人最近一次查询航班的时间;第三特征值,用于指示票务订单的下单时间与下单人最近一次查询航班的时间之间的时间间隔;第四特征值,用于指示下单人最近一次查询航班的时间与前一次查询航班的时间之间的时间间隔;第五特征值,用于指示下单人在票务订单的下单时间之前的第二时间段内查询航班的次数;第六特征值,用于指示下单人的最近一次查询地点重合度;第七特征值,用于指示下单人最近一次查询航班为第一时间段内的第几次查询;第八特征值,用于指示下单人在第一时间段内是否查询过票务订单中的航班。

预测单元300,用于将特征数据输入预先完成训练的恶意行为识别模型,得到恶意行为识别模型对特征数据处理后输出的恶意占座概率。

识别单元400,用于在恶意占座概率大于预设的概率阈值的情况下,确定票务订单为恶意占座订单。

本申请实施例提供的恶意占座订单的识别装置,在接收到票务订单时,获取该票务订单的下单人在下单时刻之前的第一时间段内的航班查询数据、以及该票务订单的订单数据,之后基于航班查询数据和订单数据确定特征数据,其中,特征数据包括多个维度的特征值,之后将特征数据输入预先完成训练的恶意行为识别模型,由恶意行为识别模型对输入的特征数据进行处理,输出该票务订单的恶意占座概率,如果该票务订单的恶意占座概率大于预设的概率阈值,则确定该票务订单为恶意占座订单。基于本申请实施例提供的恶意占座订单的识别装置,在接收到票务订单时,将下单人在下单之前的一段时间内的航班查询数据,以及该票务订单的订单数据作为依据,从中获取多个维度的特征值,基于多个维度的特征值以及预先完成训练的恶意行为识别模型,能够准确地识别该票务订单是否为恶意占座订单,从而使得航空公司可以对恶意占座订单进行处理,缓解恶意占座的问题。

在本申请的另一个实施例中,在上述恶意占座订单的识别装置中,数据获取单元100具体用于:

从消息分发系统获取全渠道数据;对所述全渠道数据进行解析,获取所述下单人在当前时刻之前的第一时间段内的航班查询数据、以及所述票务订单的订单数据。

在本申请的另一个实施例中,在上述恶意占座订单的识别装置的基础上,进一步设置模型训练单元。该模型训练单元用于:

获得多个训练样本,其中,一个训练样本基于一个样本票务订单生成,每个训练样本均具有标注信息,标注信息用于指示样本票务订单是否为恶意占座订单,出票的样本票务订单确定为正常订单,未出票的样本票务订单确定为恶意占座订单;利用预先构建的学习模型对训练样本进行预测,获得预测结果;根据预测结果和标注信息调整学习模型,直至调整后的学习模型满足预设收敛条件,将满足预设收敛条件的学习模型确定为恶意行为识别模型。

在本申请的另一个实施例中,在上述恶意占座订单的识别装置的基础上,模型训练单元采用如下方式生成训练样本:

获得样本票务订单的下单人在下单时刻之前的第一时间段内的航班查询数据,获得样本票务订单的订单数据;根据该样本票务订单的下单人在下单时刻之前的第一时间段内的航班查询数据、以及该样本票务订单的订单数据,确定该样本票务订单的特征数据,将该样本票务订单的特征数据作为一个训练样本;获取该样本票务订单的出票信息;根据该样本票务订单的出票信息对该训练样本进行标注。

在本申请的另一个实施例中,在上述恶意占座订单的识别装置的基础上,模型训练单元获得样本票务订单的下单人在下单时刻之前的第一时间段内的航班查询数据,获得所述样本票务订单的订单数据,具体为:

获得生产日志;对所述生产日志进行解析,获取样本票务订单的下单人的全渠道信息;对样本票务订单的下单人的全渠道信息进行解析,获取样本票务订单的下单人在下单时刻之前的第一时间段内的航班查询数据、以及样本票务订单的订单数据。

本申请另一个实施例还提供一种电子设备,以实现本申请上述提供的恶意占座订单的识别方法。

参见图4,图4为本申请另一个实施例提供的电子设备的结构示意图。该电子设备可以包括处理器401、存储器402和通信接口403。

可选的,该服务器还可以包括:输入单元404、显示器405和通信总线406。其中,处理器401、存储器402、通信接口403、输入单元404、显示器405均通过通信总线406完成相互间的通信。

在本申请实施例中,该处理器401可以为中央处理器(Central Processing Unit,CPU),特定应用集成电路,数字信号处理器、现成可编程门阵列或者其他可编程逻辑器件等。

该处理器401可以调用存储器402中存储的程序。

存储器402中用于存放一个或者一个以上程序,程序可以包括程序代码,所述程序代码包括计算机操作指令。在本申请实施例中,该存储器中存储有用于实现上述任意一种恶意占座订单的识别方法的程序。

在一种可能的实现方式中,该存储器402可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、以上所提到的程序等;存储数据区可存储根据计算机设备的使用过程中所创建的数据等。

此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器。

该通信接口403可以为通信模块的接口。

该输入单元404可以包括感应触摸显示面板上的触摸事件的触摸感应单元、键盘等等。

该显示器405包括显示面板,如触摸显示面板等。

当然,图4所示的电子设备的结构并不构成对本申请实施例中电子设备的限定,在实际应用中电子设备可以包括比图4所示的更多或更少的部件,或者组合某些部件。

需要说明的是,本申请实施例中的电子设备可以包括但不限于服务器,例如,服务器集群或一台独立的服务器。图4示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。

本申请另一个实施例提供一种电子设备可执行的存储介质,该存储介质中存储有程序,该程序由电子设备的处理器加载并执行时,使得电子设备实现本申请上述公开的任意一种恶意占座订单的识别方法。

需要说明的是,本申请上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质可以是但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。

根据本申请的一个或多个实施,提供了一种恶意占座订单的识别方法,包括:

当接收到票务订单时,获取下单人在当前时刻之前的第一时间段内的航班查询数据,获取所述票务订单的订单数据;

根据所述航班查询数据和所述订单数据确定特征数据,所述特征数据包括:第一特征值,用于指示所述票务订单为所述下单人在所述第一时间段内的第几次下单;第二特征值,用于指示所述下单人最近一次查询航班的时间;第三特征值,用于指示所述票务订单的下单时间与所述下单人最近一次查询航班的时间之间的时间间隔;第四特征值,用于指示所述下单人最近一次查询航班的时间与前一次查询航班的时间之间的时间间隔;第五特征值,用于指示所述下单人在所述票务订单的下单时间之前的第二时间段内查询航班的次数;第六特征值,用于指示所述下单人的最近一次查询地点重合度;第七特征值,用于指示所述下单人最近一次查询航班为所述第一时间段内的第几次查询;第八特征值,用于指示所述下单人在所述第一时间段内是否查询过所述票务订单中的航班;

将所述特征数据输入预先完成训练的恶意行为识别模型,得到所述恶意行为识别模型对所述特征数据处理后输出的恶意占座概率;

如果所述恶意占座概率大于预设的概率阈值,则确定所述票务订单为恶意占座订单。

根据本申请的一个或多个实施例,在上述恶意占座订单的识别方法的基础上,所述获取所述下单人在当前时刻之前的第一时间段内的航班查询数据,获取所述票务订单的订单数据,包括:

从消息分发系统获取全渠道数据;

对所述全渠道数据进行解析,获取所述下单人在当前时刻之前的第一时间段内的航班查询数据、以及所述票务订单的订单数据。

根据本申请的一个或多个实施例,在上述恶意占座订单的识别方法的基础上,所述航班查询数据包括:所述下单人查询航班的时间、以及所述下单人查询航班的起飞-到达城市对;所述订单数据包括:所述票务订单的下单时间、以及所述票务订单中航班的起飞-到达城市对。

根据本申请的一个或多个实施例,在上述恶意占座订单的识别方法的基础上,所述恶意行为识别模型的训练过程包括:

获得多个训练样本,其中,一个训练样本基于一个样本票务订单生成,每个训练样本均具有标注信息,所述标注信息用于指示所述样本票务订单是否为恶意占座订单,出票的样本票务订单确定为正常订单,未出票的样本票务订单确定为恶意占座订单;

利用预先构建的学习模型对所述训练样本进行预测,获得预测结果;

根据所述预测结果和标注信息调整所述学习模型,直至调整后的学习模型满足预设收敛条件,将满足所述预设收敛条件的学习模型确定为所述恶意行为识别模型。

根据本申请的一个或多个实施例,在上述恶意占座订单的识别方法的基础上,采用如下方式生成训练样本:

获得样本票务订单的下单人在下单时刻之前的第一时间段内的航班查询数据,获得所述样本票务订单的订单数据;

根据所述样本票务订单的下单人在下单时刻之前的第一时间段内的航班查询数据、以及所述样本票务订单的订单数据,确定所述样本票务订单的特征数据,将所述样本票务订单的特征数据作为一个训练样本;

获取所述样本票务订单的出票信息;

根据所述样本票务订单的出票信息对所述训练样本进行标注。

根据本申请的一个或多个实施例,在上述恶意占座订单的识别方法的基础上,所述获得样本票务订单的下单人在下单时刻之前的第一时间段内的航班查询数据,获得所述样本票务订单的订单数据,包括:

获得生产日志;

对所述生产日志进行解析,获取所述样本票务订单的下单人的全渠道信息;

对所述样本票务订单的下单人的全渠道信息进行解析,获取所述样本票务订单的下单人在下单时刻之前的第一时间段内的航班查询数据、以及所述样本票务订单的订单数据。

根据本申请的一个或多个实施例,在上述恶意占座订单的识别方法的基础上,所述预设收敛条件为:所述学习模型的识别正确率达到预设数值。

根据本申请的一个或多个实施例,提供了一种恶意占座订单的识别装置,包括:

数据获取单元,用于当接收到票务订单时,获取下单人在当前时刻之前的第一时间段内的航班查询数据,获取所述票务订单的订单数据;

特征数据获取单元,用于根据所述航班查询数据和所述订单数据确定特征数据,所述特征数据包括:第一特征值,用于指示所述票务订单为所述下单人在所述第一时间段内的第几次下单;第二特征值,用于指示所述下单人最近一次查询航班的时间;第三特征值,用于指示所述票务订单的下单时间与所述下单人最近一次查询航班的时间之间的时间间隔;第四特征值,用于指示所述下单人最近一次查询航班的时间与前一次查询航班的时间之间的时间间隔;第五特征值,用于指示所述下单人在所述票务订单的下单时间之前的第二时间段内查询航班的次数;第六特征值,用于指示所述下单人的最近一次查询地点重合度;第七特征值,用于指示所述下单人最近一次查询航班为所述第一时间段内的第几次查询;第八特征值,用于指示所述下单人在所述第一时间段内是否查询过所述票务订单中的航班;

预测单元,用于将所述特征数据输入预先完成训练的恶意行为识别模型,得到所述恶意行为识别模型对所述特征数据处理后输出的恶意占座概率;

识别单元,用于在所述恶意占座概率大于预设的概率阈值的情况下,确定所述票务订单为恶意占座订单。

根据本申请的一个或多个实施例,在上述恶意占座订单的识别装置的基础上,所述数据获取单元具体用于:

从消息分发系统获取全渠道数据;对所述全渠道数据进行解析,获取所述下单人在当前时刻之前的第一时间段内的航班查询数据、以及所述票务订单的订单数据。

根据本申请的一个或多个实施例,在上述恶意占座订单的识别装置的基础上,进一步设置模型训练单元,所述模型训练单元用于:

获得多个训练样本,其中,一个训练样本基于一个样本票务订单生成,每个训练样本均具有标注信息,所述标注信息用于指示所述样本票务订单是否为恶意占座订单,出票的样本票务订单确定为正常订单,未出票的样本票务订单确定为恶意占座订单;利用预先构建的学习模型对所述训练样本进行预测,获得预测结果;根据所述预测结果和标注信息调整所述学习模型,直至调整后的学习模型满足预设收敛条件,将满足所述预设收敛条件的学习模型确定为所述恶意行为识别模型。

根据本申请的一个或多个实施例,在上述恶意占座订单的识别装置的基础上,模型训练单元采用如下方式生成训练样本:

获得样本票务订单的下单人在下单时刻之前的第一时间段内的航班查询数据,获得所述样本票务订单的订单数据;

根据所述样本票务订单的下单人在下单时刻之前的第一时间段内的航班查询数据、以及所述样本票务订单的订单数据,确定所述样本票务订单的特征数据,将所述样本票务订单的特征数据作为一个训练样本;

获取所述样本票务订单的出票信息;

根据所述样本票务订单的出票信息对所述训练样本进行标注。

根据本申请的一个或多个实施例,在上述恶意占座订单的识别装置的基础上,模型训练单元获得样本票务订单的下单人在下单时刻之前的第一时间段内的航班查询数据,获得所述样本票务订单的订单数据,具体为:

获得生产日志;

对所述生产日志进行解析,获取所述样本票务订单的下单人的全渠道信息;

对所述样本票务订单的下单人的全渠道信息进行解析,获取所述样本票务订单的下单人在下单时刻之前的第一时间段内的航班查询数据、以及所述样本票务订单的订单数据。

根据本申请的一个或多个实施例,提供了一种电子设备,包括处理器、存储器和通信接口;

所述处理器用于执行所述存储器中存储的程序;

所述存储器用于存储程序,所述程序至少用于:

当接收到票务订单时,获取下单人在当前时刻之前的第一时间段内的航班查询数据,获取所述票务订单的订单数据;

根据所述航班查询数据和所述订单数据确定特征数据,所述特征数据包括:第一特征值,用于指示所述票务订单为所述下单人在所述第一时间段内的第几次下单;第二特征值,用于指示所述下单人最近一次查询航班的时间;第三特征值,用于指示所述票务订单的下单时间与所述下单人最近一次查询航班的时间之间的时间间隔;第四特征值,用于指示所述下单人最近一次查询航班的时间与前一次查询航班的时间之间的时间间隔;第五特征值,用于指示所述下单人在所述票务订单的下单时间之前的第二时间段内查询航班的次数;第六特征值,用于指示所述下单人的最近一次查询地点重合度;第七特征值,用于指示所述下单人最近一次查询航班为所述第一时间段内的第几次查询;第八特征值,用于指示所述下单人在所述第一时间段内是否查询过所述票务订单中的航班;

将所述特征数据输入预先完成训练的恶意行为识别模型,得到所述恶意行为识别模型对所述特征数据处理后输出的恶意占座概率;

如果所述恶意占座概率大于预设的概率阈值,则确定所述票务订单为恶意占座订单。

根据本申请的一个或多个实施例,提供一种存储介质,所述存储介质中存储有程序,所述程序被处理器加载并执行时,实现本申请提供的任意一种恶意占座订单的识别方法。

实施中,可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

需要说明的是,附图中的流程图和框图,图示了按照本申请各种实施例的方法、装置和电子设备可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

本申请实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。

虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。

尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号