首页> 中国专利> 构建和训练用于预测客流量的集成预测模型的方法及装置

构建和训练用于预测客流量的集成预测模型的方法及装置

摘要

本发明公开了一种构建和训练用于预测客流量的集成预测模型的方法及装置,包括:利用多种彼此不同的算法构成集成预测模型的基学习器;利用与构成所述基学习器的算法不同的算法作为集成预测模型的元学习器;将解释变量划分为训练集和验证集,利用所述训练集和验证集对所述基学习器进行机器学习,输出预测结果变量集;将所述基学习器输出的预测结果变量集划分为用于元学习器的训练集和验证集,利用所述用于元学习器的训练集和验证集对所述元学习器进行机器学习,从而获得集成预测模型。该实施方式有效避免了数据缺失等导致的预测结果准确性差的问题,同时模型泛化性能高。

著录项

  • 公开/公告号CN112257868A

    专利类型发明专利

  • 公开/公告日2021-01-22

    原文格式PDF

  • 申请/专利权人 建信金融科技有限责任公司;

    申请/专利号CN202011027112.8

  • 发明设计人 吴凡;李晓莉;赵昭;

    申请日2020-09-25

  • 分类号G06N20/00(20190101);G06N20/20(20190101);

  • 代理机构11219 中原信达知识产权代理有限责任公司;

  • 代理人张一军;王安娜

  • 地址 200120 上海市自由贸易试验区银城路99号12层、15层

  • 入库时间 2023-06-19 09:36:59

说明书

技术领域

本发明涉及计算机技术领域,尤其涉及一种构建和训练用于预测客流量的集成预测模型的方法及装置。

背景技术

商业银行在当代经济社会生活中发挥着重要的作用。各大银行众多营业网点每天需要接待成千上百的客户。目前,不同时间段的银行网点客流量不一致,其中部分时间段客流量比较大,大量客户同时办理业务,营业网点窗口不足,造成网点内大量用户排队,进而造成银行网点的工作环境混乱,服务质量难以提高,客户满意度低,银行产品无法有效营销。而部分时间段客流量又比较小,造成窗口过剩,引起资源的浪费。因此,营业网点客流量预测对于合理安排窗口排布,降低客户等待时间,提高网点运营效率和客户满意度具有重要意义。

为了提供高效率的服务、营造良好的营业环境,银行营业网点需要预测营业网点客流量以便能够依据预测结果进行资源合理分配。因此,出于提高网点工作效率,降低成本,大幅度提高客户满意度和银行产品营销收益的目的,提出适合于银行业的预测模型具有重要的经济意义。

在实现本发明过程中,发明人发现现有技术中至少存在如下问题:

在过去的40年里,预测模型所出现的创新少之又少,而这些创新几乎均为在行业、地域和数据采集方法之间对工具做出的调整。另一方面,一般预测方法是使用诸如时间序列模型线性回归模型等的单一预测模型,构建此类模型或需要连续时间的信息,或对缺失值敏感。因此在数据条件较差的情况下,难以做出准确预测。同时,单一模型泛化性能不理想,难以在实际生产中运用。换句话说,现有技术中,以多元线性回归模型为代表的、可用于客流量预测方法普遍存在预测准确性不足,稳定性差的问题。

发明内容

有鉴于此,本发明实施例提供一种建立和训练集成预测模型的方法,通过集成泛化技术,构建和训练具有强稳健性的集成预测模型。并且,有效的解决了特定业务情境下数据维度高、数据量少导致的预测精度差、稳定性不高的问题。

为实现上述目的,根据本发明实施例的一个方面,提供了构建和训练用于预测客流量的集成预测模型的方法。

本发明实施例的一种构建和训练用于预测客流量的集成预测模型的方法包括:

利用多种彼此不同的算法构成集成预测模型的基学习器;

利用与构成所述基学习器的算法不同的算法作为集成预测模型的元学习器;

将解释变量划分为训练集和验证集,利用所述训练集和验证集对所述基学习器进行机器学习,输出预测结果变量集;

将所述基学习器输出的预测结果变量集划分为用于元学习器的训练集和验证集,利用所述用于元学习器的训练集和验证集对所述元学习器进行机器学习,从而获得集成预测模型。

可选地,该方法还包括:利用XGBoost模型作为所述元学习器。

可选地,该方法还包括:确定所述XGBoost模型的参数值搜索范围;

在所确定的参数值搜索范围的基础上,使用遗传算法对参数数值空间进行搜索;以及

根据遗传算法的搜索结果,确定构成所述元学习器的模型的参数设置。

可选地,该方法还包括:利用多元线性回归模型作为基学习器。

可选地,该方法还包括:利用支持向量回归模型作为所述基学习器。

可选地,该方法还包括:利用Lasso回归模型作为所述基学习器。

可选地,该方法还包括:利用XGBoost模型作为所述基学习器。

可选地,该方法还包括:通过获取特定银行网点的既往客流量数据,并对所述既往客流量数据进行数据清洗操作,来获得所述解释变量。

为实现上述目的,根据本发明实施例的又一方面,提供了一种构建和训练用于预测客流量的集成预测模型的装置。

本发明实施例的一种构建和训练用于预测客流量的集成预测模型的装置包括:基学习器构建模块、元学习器构建模块、基学习器学习模块和元学习器学习模块;其中,

所述基学习器构建模块,用于利用多种彼此不同的算法构成集成预测模型的基学习器;

元学习器构建模块,用于利用与构成所述基学习器的算法不同的算法作为集成预测模型的元学习器;

所述基学习器学习模块,用于将解释变量划分为训练集和验证集,利用所述训练集和验证集对所述基学习器进行机器学习,输出预测结果变量集;

所述元学习器学习模块,用于将所述基学习器输出的预测结果变量集划分为用于元学习器的训练集和验证集,利用所述用于元学习器的训练集和验证集对所述元学习器进行机器学习,从而获得集成预测模型。

为实现上述目的,根据本发明实施例的又一方面,提供了一种构建和训练用于预测客流量的集成预测模型的电子设备。

本发明实施例的一种构建和训练用于预测客流量的集成预测模型的电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例的一种构建和训练用于预测客流量的集成预测模型的方法。

为实现上述目的,根据本发明实施例的再一方面,提供了一种计算机可读存储介质。

本发明实施例的一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例的一种构建和训练用于预测客流量的集成预测模型的方法。

上述发明中的一个实施例具有如下优点或有益效果:与现有技术的单一预测模型不同,本申请提出的构建和训练方法通过堆栈泛化技术将多个单一预测模型融合为一个具有强稳健性的集成预测模型。集成预测模型与单一预测模型相比拥有更好的预测精度、稳健性和泛化能力。利用堆栈泛化的集成模型,充分利用了例如银行网点客流量的现有数据的多维小数据集,同时可以有效避免数据缺失等导致的预测结果准确性差,模型泛化性能差的问题。因此,在预测信息类别少,数据缺失较多的银行营业网点客流量预测数据环境下,可应用集成模型以提高预测准确性。并且,有效的解决了特定业务情境下数据维度高、数据量少导致的预测精度差、稳定性不高的问题。

上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。

附图说明

附图用于更好地理解本发明,不构成对本发明的不当限定。其中:

图1是根据本发明实施例的一种构建和训练用于预测客流量的集成预测模型的方法的主要步骤的示意图;

图2是根据本发明实施例的一种构建和训练用于预测客流量的集成预测模型的装置的主要模块的示意图;

图3是本发明实施例可以应用于其中的示例性系统架构图;

图4是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。

具体实施方式

以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

需要指出的是,在不冲突的情况下,本发明的实施例以及实施例中的技术特征可以相互结合。

根据本发明的集成模型指的是计算机集成模型,其主要用于分类和预测等活动。在本发明中,集成是指通过Bagging、Boosting和Stacking三类方法将单一模型融合为一个集成模型。本发明中使用的集成方法例如可以是堆栈泛化(Stacking Generalization),其在集成方法上属于上述的Stacking,并且更具体地,是一种构建两层或以上的学习器网络的方法。所构建的第一层学习器可以被称为基学习器(Base-Learner),所构建的第二层学习器可以被称为元学习器(Meta-Learner)。根据本发明的堆栈泛化所构建的基学习器可由多个不同类型的算法组成,因此,由此构建的集成模型也称为异源集成模型。

图1是根据本发明实施例的一种构建和训练用于预测客流量的集成预测模型的方法的主要步骤的示意图。

如图1所示,本发明实施例的一种构建和训练用于预测客流量的集成预测模型的方法包括步骤S101:利用多种彼此不同的算法构成集成预测模型的基学习器。

如图1所示,本发明实施例的一种构建和训练用于预测客流量的集成预测模型的方法还包括步骤S102:利用与构成所述基学习器的算法不同的算法作为集成预测模型的元学习器。

如图1所示,本发明实施例的一种构建和训练用于预测客流量的集成预测模型的方法还包括步骤S103:将解释变量划分为训练集和验证集,利用所述训练集和验证集对所述基学习器进行机器学习,输出预测结果变量集。

如图1所示,本发明实施例的一种构建和训练用于预测客流量的集成预测模型的方法还包括步骤S104:将所述基学习器输出的预测结果变量集划分为用于元学习器的训练集和验证集,利用所述用于元学习器的训练集和验证集对所述元学习器进行机器学习,从而获得集成预测模型。

在一种实施方式中,重复地执行上述步骤S103-S104,使得所有解释变量均被用于对基学习器的训练和预测。

下面将对如图1所示的各个步骤进行详细描述。

<步骤S101>

根据本发明的步骤S101,利用多种彼此不同的算法构成集成预测模型的基学习器。

在步骤S101中,例如以在下文中描述的多元线性回归(MLR)、Lasso回归、支持向量回归(SVR)和XGBoost(Extreme Gradient Boosting)算法来构成基学习器。

在这些算法中,多元线性回归是研究不确定性关系的有效统计算法。该算法是最早用于预测活动的算法,也是目前生产生活预测中应用最广的一种算法。

Lasso回归是一种回归分析算法,其可同时实现变量选择和正则化,并且广泛应用于统计学和机器学习领域。Lasso回归算法也是目前电影票房预测的一种常用方法。Lasso回归算法具有在高维变量的计算可行性且易产生可解释的稀疏解,可很好地用于特征选择。

SVR算法是支持向量机在回归问题上的应用。将SVR算法用于客流量预测,方法较为成熟。

XGBoost算法属于集成方法中的同源集成,是上述Boosting方法的一种,是一种灵活可扩展的梯度提升方法,具有结果可解释性强,对缺失值不敏感,支持列抽样等优点,在预测研究中具有良好的适用性。

<步骤S102>

根据本发明的步骤S102,利用与构成所述基学习器的算法不同的算法作为集成预测模型的元学习器。

在该步骤S102中,还包括通过遗传算法对元学习器进行参数优化。将在下文中对该参数优化进行详细描述。

在本发明中,一种实施方式是采用XGBoost算法来作为元学习器。然而,传统的XGBoost算法参数调整一般使用网格搜索,根据实际经验,固定一部分参数,然后对其余参数进行网格搜索,并逐一对所有参数进行上述操作。传统的XGBoost算法的优点是操作简单,可利用自身经验快速确定参数,缺点同样明显,其优化的参数只取得了局部最优,无法获得全局最优解。

针对这一技术问题,本发明在采用XGBoost算法来作为元学习器之后,进一步采用遗传算法搜寻XGBoost算法最优参数。

本发明所采用的遗传算法是一种随机算法,其模拟自然选择,“种群”通过杂交,变异,精英等方式不断进化,进而获得在指定域的较优解。其优点是算法复杂度与数据维度无关,因此在较高维度上仍能实现快速求解。在下文的实施例中详细描述本发明使用的遗传算法。

在根据本发明的实施例中,根据在预测中数据维度较高,数据量较少的数据环境,初步确定最大树深度(max depth)参数值为3,正则系数(lambda)取0,同时结合实验用计算机运算能力和实验经验,将树子指标集比例(colsample)固定为1。在3个固定的参数值基础上,确定了如下表的参数值搜索范围。

表1待确定参数及搜索范围

在初步确定的参数范围基础上,使用遗传算法对上述参数数值空间进行搜索。遗传算法的初始种群大小为10,迭代次数设定为20,以训练集MAPE值最低为优化目标。经过不断尝试,运行超过60个参数组合,平均每组参数组合运行时间32分钟。

根据遗传算法最终结果,对参数调整如下:

表2参数调优结果

根据表2,利用确定的参数设置,能够得到经过参数优化的元学习器。

<步骤S103>

根据本发明的步骤S103,将解释变量划分为训练集和验证集,利用所述训练集和验证集对所述基学习器进行机器学习,输出预测结果变量集。

解释变量通过如下方式获得:首先,获取某网点既往客流量数据,集合以往研究和数据分析,从而得到源数据。随后,针对源数据进行数据清洗操作,从而得到可以用来训练和验证基学习器的解释变量。

将解释变量划分为训练集和验证集,利用该训练集和验证集分别对构成基学习器的每种算法进行机器学习。具体地,利用训练集和验证集循环地对构成基学习器的每种算法进行训练和验证,以确保训练集与验证集中的每个数据都能被训练和验证。

<步骤S104>

根据本发明的步骤S104,将所述基学习器输出的预测结果变量集划分为用于元学习器的训练集和验证集,利用所述用于元学习器的训练集和验证集对所述元学习器进行机器学习,从而获得集成预测模型。

具体地,在步骤S104中,使用每个验证子集预测结果作为输入变量训练学习器,在输入到基学习器的解释变量中的每个数据均被用于基学习器以及元学习器的训练和验证之后,才得到训练后的基学习器和训练后的元学习器所构建的集成预测模型。

相应地,根据本发明的一个实施方式,重复地执行上述步骤S103-S104,直到解释变量中的每个数据均被用于基学习器的训练和验证。

图2是根据本发明实施例的一种构建和训练用于预测客流量的集成预测模型的装置的主要模块的示意图。

如图2所示,本发明实施例的一种构建和训练用于预测客流量的集成预测模型的装置200包括:基学习器构建模块201、元学习器构建模块502、基学习器学习模块203和元学习器学习模块204;其中,

所述基学习器构建模块201,利用多种彼此不同的算法构成集成预测模型的基学习器;

元学习器构建模块202,利用与构成所述基学习器的算法不同的算法作为集成预测模型的元学习器;

所述基学习器学习模块203,将解释变量划分为训练集和验证集,利用所述训练集和验证集对所述基学习器进行机器学习,输出预测结果变量集;

所述元学习器学习模块204,将所述基学习器输出的预测结果变量集划分为用于元学习器的训练集和验证集,利用所述用于元学习器的训练集和验证集对所述元学习器进行机器学习,从而获得集成预测模型。

在本发明一个实施例中,在元学习器构建模块202中,利用XGBo ost模型作为所述元学习器。

在本发明一个实施例中,在元学习器构建模块202中,对所述元学习器进行模型参数优化。

在本发明一个实施例中,所述模型参数优化包括:

确定所述XGBoost模型的参数值搜索范围;

在所确定的参数值搜索范围的基础上,使用遗传算法对参数数值空间进行搜索;以及

根据遗传算法的搜索结果,确定构成所述元学习器的模型的参数设置。

根据本发明实施例的一种构建和训练用于预测客流量的集成预测模型的装置可以看出,能够通过堆栈泛化技术将多个单一预测模型融合为一个具有强稳健性的集成预测模型。利用堆栈泛化的集成模型,充分利用了例如银行网点客流量的现有数据的多维小数据集,同时可以有效避免数据缺失等导致的预测结果准确性差,模型泛化性能差的问题。因此,在预测信息类别少,数据缺失较多的银行营业网点客流量预测数据环境下,可应用集成模型以提高预测准确性。并且,有效的解决了特定业务情境下数据维度高、数据量少导致的预测精度差、稳定性不高的问题。

图3示出了可以应用本发明实施例的一种构建和训练用于预测客流量的集成预测模型的方法或一种构建和训练用于预测客流量的集成预测模型的装置的示例性系统架构300。

如图3所示,系统架构300可以包括终端设备301、302、303,网络304和服务器305。网络304用以在终端设备301、302、303和服务器305之间提供通信链路的介质。网络304可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备301、302、303通过网络304与服务器305交互,以接收或发送消息等。终端设备301、302、303上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备301、302、303可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器305可以是提供各种服务的服务器,例如对用户利用终端设备301、302、303所浏览的购物类网站提供支持的后台管理服务器。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息)反馈给终端设备。

需要说明的是,本发明实施例所提供的构建和训练用于预测客流量的集成预测模型的方法一般由服务器305执行,相应地,构建和训练用于预测客流量的集成预测模型的装置一般设置于服务器605中。

应该理解,图3中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。

下面参考图4,其示出了适于用来实现本发明实施例的终端设备的计算机系统400的结构示意图。图4示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

如图4所示,计算机系统400包括中央处理单元(CPU)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储部分408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有系统400操作所需的各种程序和数据。CPU 401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。

以下部件连接至I/O接口405:包括键盘、鼠标等的输入部分406;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分407;包括硬盘等的存储部分408;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分409。通信部分409经由诸如因特网的网络执行通信处理。驱动器410也根据需要连接至I/O接口405。可拆卸介质411,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器410上,以便于从其上读出的计算机程序根据需要被安装入存储部分408。

特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分409从网络上被下载和安装,和/或从可拆卸介质411被安装。在该计算机程序被中央处理单元(CPU)401执行时,执行本发明的系统中限定的上述功能。

需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。

附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括基学习器构建模块、元学习器构建模块、基学习器学习模块和元学习器学习模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定。

作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备执行下述方法:利用多种彼此不同的算法构成集成预测模型的基学习器;利用与构成所述基学习器的算法不同的算法作为集成预测模型的元学习器;将解释变量划分为训练集和验证集,利用所述训练集和验证集对所述基学习器进行机器学习,输出预测结果变量集;将所述基学习器输出的预测结果变量集划分为用于元学习器的训练集和验证集,利用所述用于元学习器的训练集和验证集对所述元学习器进行机器学习,从而获得集成预测模型。

根据本发明实施例的技术方案,能够通过堆栈泛化技术将多个单一预测模型融合为一个具有强稳健性的集成预测模型。利用堆栈泛化的集成模型,充分利用了例如银行网点客流量的现有数据的多维小数据集,同时可以有效避免数据缺失等导致的预测结果准确性差,模型泛化性能差的问题。因此,在预测信息类别少,数据缺失较多的银行营业网点客流量预测数据环境下,可应用集成模型以提高预测准确性。并且,有效的解决了特定业务情境下数据维度高、数据量少导致的预测精度差、稳定性不高的问题。

上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号