首页> 中国专利> 基于人工智能的房间个性化需求模型

基于人工智能的房间个性化需求模型

摘要

本公开涉及基于人工智能的房间个性化需求模型。更具体而言,实施例对宾馆房间的需求和定价进行建模。实施例接收关于多个先前客人的历史数据,该历史数据包括多个属性,该多个属性包括客人属性、旅行属性和外部因素属性。实施例使用机器学习软聚类基于多个属性来生成多个不同的聚类,并且将每个先前客人细分到一个或多个不同的聚类中。实施例为每个不同的聚类建立模型,该模型预测客人选择某个房间类别的概率并且包括与属性对应的多个变量。实施例消除模型的不重要变量并且估计模型的模型参数,模型参数包括与变量对应的系数。实施例使用模型参数和个性化的定价算法来确定宾馆房间的最优定价。

著录项

  • 公开/公告号CN113015986A

    专利类型发明专利

  • 公开/公告日2021-06-22

    原文格式PDF

  • 申请/专利权人 甲骨文国际公司;

    申请/专利号CN202080005079.0

  • 申请日2020-08-17

  • 分类号G06Q10/04(20120101);G06Q10/06(20120101);G06Q30/02(20120101);G06Q50/12(20120101);G06N20/00(20190101);

  • 代理机构11038 中国贸促会专利商标事务所有限公司;

  • 代理人边海梅

  • 地址 美国加利福尼亚

  • 入库时间 2023-06-19 11:32:36

说明书

相关申请的交叉引用

本申请要求于2019年10月21日提交的美国临时专利申请序列No.62/923,779的优先权,该申请的公开内容通过引用并入本文。

技术领域

一个实施例总体上涉及一种计算机系统,并且特别地涉及生成基于人工智能的房间个性化需求模型的计算机系统。

背景技术

宾馆行业竞争的加剧导致宾馆经营者寻求更具创新性的收入管理策略,诸如个性化定价和推荐。在过去的几年中,宾馆经营者开始意识到并非所有客人都是一样的,并且传统的“通用型(one-size-fits-all)”策略可能被证明是无效的。因此,对于宾馆而言存在剖析其客人概况并以适当的价格向客人提供适当的产品/服务以使宾馆的利润最大化的需求。

发明内容

实施例对宾馆房间的需求和定价进行建模。实施例接收关于多个先前客人的历史数据,该历史数据包括多个属性,该多个属性包括客人属性、旅行属性和外部因素属性。实施例使用机器学习软聚类基于多个属性来生成多个不同的聚类,并且将每个先前客人细分(segment)到一个或多个不同的聚类中。实施例为每个不同的聚类建立模型,该模型预测客人选择某个房间类别的概率并且包括与属性对应的多个变量。实施例消除模型的不重要变量并且估计模型的模型参数,模型参数包括与变量对应的系数。实施例使用模型参数和个性化的定价算法来确定宾馆房间的最优定价。

附图说明

通过下面结合附图对实施例的详细描述,其它实施例、细节、优点和修改将变得显而易见。

图1是根据本发明的实施例的计算机服务器/系统的框图。

图2是图示根据实施例的图1的房间需求模型模块的功能的流程图。

图3图示了根据一个实施例的基于属性的聚类的示例。

图4图示了根据一个实施例的使用随机森林机器学习进行关联的聚类的另一个示例。

图5图示了根据一个实施例的将混合MNL模型应用于每个聚类以估计需求的示例。

图6图示了根据一个实施例的完整的个性化需求模型。

图7图示了根据一个实施例的似然函数的示例。

图8图示了根据实施例的变量选择算法。

图9和图10图示了本发明的使用实验数据集来预测特定客人选择某种房间类别的概率的实施例的结果。

图11图示了根据本发明的实施例的实验研究的结果。

具体实施方式

实施例利用人工智能(“AI”)基于宾馆客人的个体属性、他们的预订渠道以及房间类别特征(包括提供的价格)来预测对多种宾馆房间类别的需求。实施例还估计作为不可观察的变量的“不购买客人”的比例,或决定不预订宾馆房间的客人的数量。实施例输出每个个体客人预订特定房间类别中的房间的概率。实施例还针对宾馆客人的每种聚类估计房间特征的相对货币价值。房间特征的示例可以是床的类型(例如,特大床与双人床)、景观(例如,海景或花园)、房间的大小,或房间的类型(例如,套房与单人房)。为了基于客人特性以及房间特征来生成个性化需求模型,实施例使用多项式选择建模的聚类和混合的组合。

宾馆行业中的传统收益管理(“RM”)做法使用容量控制机制,特别是通常使用停留时间控制来控制不同类别产品的房间可用性。一般而言,宾馆行业不使用基于宾馆客人的个体属性、他们的预订渠道以及房间类别特征的高级需求模型。但是,近年来,宾馆行业的经营状况已发生重大变化。鉴于经由互联网提供的房价透明性,合作旅行管理公司、休闲旅行代理和品牌网站已转移到公共的分销平台并开始接触彼此的顾客群体。然后,搜索引擎甚至进一步提高了这种透明度,从而将所有分销渠道的在线费率汇总到单个界面中,并将价格显示为宾馆房间之间最显著的差异之一。

在这种竞争激烈的环境中,在假设对产品的需求不取决于其它可获得的选择的前提下操作的传统RM解决方案在细分具有严格(well-fenced)限制的客人时效果不佳。因此,宾馆需要转向基于客人的付款意愿和价格弹性的价格优化解决方案。

尤其对于在线销售而言,个性化的需求建模和价格优化在宾馆行业中的使用相对较少,部分原因是难以将这些方法直接应用于宾馆预订。当前,宾馆行业使用的大多数需求预测工具旨在基于时间序列分析提供预订总数,从而忽略了需求价格弹性和房间类别特征。在存在具有显著不同付款意愿的多样化客人的情况下,这些需求建模工具通常是无效的。

与已知的解决方案相比,实施例通过首先通过基于客人、旅行和外部属性应用基于机器学习的软聚类模型将客人群体划分为不同的聚类来实现个性化策略。已知的解决方案通常在假设同类客人的情况下仅基于容易分离的客人(诸如,出行目的(例如,休闲或商务))完成此聚类。在实践中,这可能太具限制而无法应用,因为客人具有需要不同选择模型的其自己的特性。即使对于具有相似属性的一些客人,其选择概率也可能取决于外部属性,诸如当地事件、假日以及始发地和目的地的天气。因此,实施例在选择建模中放松了客人同类性的强烈假设。

实施例包括到达和预订决策步骤的两个先前的顺序步骤。顾客可以到达(或不到达)宾馆房间预订系统。如果到达,那么顾客决定在宾馆处进行(或不进行)预订。一旦他们已到达预订系统并决定预订房间,他们就将选择房间类型。但是,一般而言,可观察的数据仅对购买了任何产品的顾客可用,并且如果实施例仅将需求模型拟合到可观察的数据,那么可能导致有偏差的估计并且没有适当地并入价格敏感性。为了避免这些可能的偏差,实施例并入了不购买的情况,在不购买的情况下,顾客可能因为对宾馆不感兴趣而没有到达预订系统,或者顾客到达预订系统但是然后由于价格高或没有可用房间而离开并没有购买。因此,与不考虑那些因素的先前行业解决方案相比,实施例可以考虑不购买情况和竞争者(或外部选项),这可以影响顾客的初始决定。

实施例将客人聚类成几个组或聚类,其中具有相似属性的客人被分配到同一聚类。此外,实施例通过允许每个客人以一定概率属于多个聚类来实现软聚类方法。实施例然后针对每个聚类建立多项式选择模型,该模型预测每个特定客人选择某种房间类别的概率。实施例使用数据驱动的交叉验证方法来确定组的数量,以确定最佳的聚类数量。

由于属性的数量通常很大,因此每个组内的数据可能稀疏,从而导致预测不准确。为了减轻这种情况,实施例实现“套索(Lasso)”正则化方法,以通过使混合多项式选择模型的惩罚似然函数最大化来将最不重要的模型协变量的系数设置为零。

为了估计参数(即,到达率、属于每个组的概率和每个协变量参数),实施例在执行基于随机森林的软聚类以找到初始聚类概率之后使用期望最大化(EM)算法。由于两个不可观察的因素(即,不购买处理和聚类处理),实施例考虑了那些潜在因素。最后,将从以上提取的参数插入到个性化定价算法中,以便为每个客人确定每种房间类型的最优价格。

现在将详细参考本公开的实施例,其示例在附图中示出。在下面的详细描述中,阐述了许多具体细节以便提供对本公开的透彻理解。但是,对于本领域的普通技术人员将显而易见的是,可以在没有这些具体细节的情况下实践本公开。在其它情况下,未详细描述众所周知的方法、过程、部件和电路,以免不必要地使实施例的各方面不清楚。只要有可能,相同的参考数字将用于相同的元素。

图1是根据本发明的实施例的计算机服务器/系统10的框图。虽然示出为单个系统,但是系统10的功能可以被实现为分布式系统。此外,本文公开的功能可以在可以通过网络耦合在一起的单独的服务器或设备上实现。此外,可以不包括系统10的一个或多个部件。例如,当被实现为基于web服务器或基于云的功能时,系统10被实现为一个或多个服务器,并且不需要诸如显示器、鼠标等的用户界面。

系统10包括用于传送信息的总线12或其它通信机制,以及耦合到总线12以处理信息的处理器22。处理器22可以是任何类型的通用或专用处理器。系统10还包括用于存储将由处理器22执行的信息和指令的存储器14。存储器14可以包括随机存取存储器(“RAM”)、只读存储器(“ROM”),诸如磁盘或光盘的静态存储器,或任何其它类型的计算机可读介质的任意组合。系统10还包括通信设备20,诸如网络接口卡,以提供对网络的访问。因此,用户可以直接或远程地通过网络或任何其它方法与系统10接口。

计算机可读介质可以是处理器22可以访问的任何可用介质,并且包括易失性和非易失性介质、可移动和不可移动介质以及通信介质。通信介质可以包括计算机可读指令、数据结构、程序模块,或调制数据信号(诸如载波或其它传输机制)中的其它数据,并且包括任何信息传递介质。

处理器22还经由总线12耦合到显示器24,诸如液晶显示器(“LCD”)。键盘26和光标控制设备28(诸如计算机鼠标)还耦合到总线12,以使用户能够与系统10接口。

在一个实施例中,存储器14存储当由处理器22执行时提供功能的软件模块。模块包括操作系统15,操作系统15为系统10提供操作系统功能。模块还包括生成房间需求模型以最大化宾馆房间收益以及本文公开的所有其它功能的房间需求模型模块16。系统10可以是更大系统的一部分。因此,系统10可以包括一个或多个附加功能模块18以包括附加功能,诸如财产管理系统(“PMS”)(例如,“Oracle Hospitality OPERA Property”或“OracleHospitality OPERA云服务”)或企业资源计划(“ERP”)系统的功能。数据库17耦合到总线12,以向模块16和18提供集中式存储,并存储客人数据、宾馆数据、交易数据等。在一个实施例中,数据库17是可以使用结构化查询语言(“SQL”)来管理存储的数据的关系数据库管理系统(“RDBMS”)。在一个实施例中,专用销售点(“POS”)终端99生成用于执行优化的交易数据和历史销售数据(例如,与宾馆客人/顾客的交易相关的数据)。根据一个实施例,POS终端99本身可以包括附加的处理功能来执行房间分配优化,并且可以本身或者结合图1的其它部件作为专用房间分配优化系统来操作。

在一个实施例中,特别是当存在大量宾馆位置、大量客人以及大量历史数据时,数据库17被实现为存储器中(in-memory)数据库(“IMDB”)。IMDB是一种数据库管理系统,其主要依赖于主存储器来存储计算机数据。与采用盘存储机制的数据库管理系统形成对比。主存储器数据库比盘优化的数据库更快,这是因为盘访问比存储器访问更慢、内部优化算法更简单、并且执行更少的CPU指令。访问存储器中的数据消除了查询数据时的搜寻时间,从而提供比盘更快且更可预测的性能。

在一个实施例中,数据库17在被实现为IMDB时,是基于分布式数据网格来实现的。分布式数据网格是一种系统,其中计算机服务器的集合在一个或多个集群中一起工作,以管理分布式或集群环境中的信息和相关操作,诸如计算。分布式数据网格可以用于管理跨服务器共享的应用对象和数据。分布式数据网格提供了低响应时间、高吞吐量、可预测的可伸缩性、连续可用性和信息可靠性。在特定示例中,分布式数据网格(诸如例如Oracle公司的“Oracle Coherence”数据网格)将信息存储在存储器中来实现更高的性能,并采用冗余来保持该信息的副本跨多个服务器同步,从而确保系统的弹性,并在服务器发生故障时确保数据的持续可用性。

在一个实施例中,系统10是计算/数据处理系统,其包括用于企业组织的应用或分布式应用的集合,并且还可以实现物流、制造和库存管理功能。应用和计算系统10可以被配置为与基于云的联网系统、软件即服务(“SaaS”)体系架构或其它类型的计算解决方案一起操作或被实现为基于云的联网系统、软件即服务体系架构或其它类型的计算解决方案。

图2是图示根据实施例的图1的房间需求模型模块16的功能的流程图。在一个实施例中,图2的流程图的功能由存储在存储器或其它计算机可读或有形介质中并由处理器执行的软件实现。在其它实施例中,功能可以由硬件来执行(例如,通过使用专用集成电路(“ASIC”)、可编程门阵列(“PGA”)、现场可编程门阵列(“FPGA”)等),或者由硬件和软件的任意组合来执行。

一般而言,图2的功能使用包括多项式选择建模的聚类和混合的组合的方法基于客人的特性以及房间特征对个性化需求模型进行建模。

在202处,从输入数据集/数据库17接收历史预订数据和客人信息。在一个实施例中,输入数据集17是来自Oracle公司的“OPERA”数据库,并且包括关于单个宾馆或一组相关宾馆的客人的详细信息,诸如连锁宾馆以及可用房间。在其它实施例中,可以使用关于用于任何类型的PMS的客人和房间的数据的数据库。在实施例中,输入数据集17经由来自在宾馆运营商的控制下的计算设备的电子通信接收,并且然后由系统10解析以提取下面公开的后续功能所需的信息。

由于未到达和未预订的顾客未被记录在数据库17中,因此它们被视为潜在变量或不可观察的变量。如下面更详细地公开的,这些潜在变量是使用期望最大化(“EM”)算法估计的,该算法迭代地拟合需求模型,以找到针对包括未到达和未预订顾客在内的所有顾客的费率的最可能的估计。

在204处,实施例使用机器学习方法(即,软聚类)将客人聚类。

为了实现个性化策略,实施例首先通过基于客人、旅行和外部属性应用基于机器学习的软聚类模型将客人群体划分为不同的聚类。已知解决方案通常在假设同类客人的情况下仅基于容易分离的客人属性(诸如,旅行目的(例如,休闲与商务))来完成此聚类。在实践中,这可能太具限制而无法应用,因为客人具有需要不同选择模型的其自己的特性。即使对于具有相似属性的一些客人,他们的选择概率也可能取决于外部属性,诸如当地事件、假日以及始发地和目的地的天气。因此,实施例在选择建模中放松了客人同类性的强烈假设。

此外,实施例添加了两个先前的顺序步骤,包括到达和预订决策步骤。顾客到达(或不到达)预订系统。如果到达,那么他们决定是否在宾馆中进行预订。一旦他们到达预订系统并决定预订房间,他们就将选择房间类型。

但是,该数据仅可用于购买了任何产品的顾客,并且如果需求模型仅拟合到可观察的数据,那么可能导致有偏差的估计并且没有适当地并入价格敏感性。为了避免这些可能的偏差,实施例并入了不购买的情况,在不购买的情况下,顾客可能因为对宾馆不感兴趣而没有到达预订系统,或者顾客到达预订系统但是然后由于价格高或没有可用房间而离开并没有购买。因此,与不考虑那些因素的已知解决方案相比,实施例可以考虑不购买情况和竞争者(或外部选项),这可以影响顾客的初始决定。

在206处,实施例执行选择建模,该选择建模开发用于估计需求的混合多项式logit模型(“MNL”)模型。针对204的每个聚类建立多项式选择模型,该模型预测每个特定客人选择某种房间类别的概率。实施例使用数据驱动的交叉验证方法来确定组的数量,以确定最佳的聚类数量。

在208处,实施例通过使用套索正则化方法消除不重要变量来执行变量选择。由于属性的数量通常相当大,因此每个组内的数据可能稀疏,从而导致预测不准确。为了减轻这种情况,套索正则化方法通过使混合多项式选择模型的惩罚似然函数最大化来将最不重要的模型协变量的系数设置为零。

在210处,实施例使用期望最大值(“EM”)算法来估计模型参数。为了估计参数(即到达率、属于每个聚类组的概率和每个协变量参数),实施例在执行基于随机森林的软聚类以找到初始聚类概率之后使用EM算法。实施例假设用于预测需求的参数模型。一般而言,参数模型是概率分布的族(family),其具有确定分布的特性的有限数量的参数。基于数据估计模型的参数,以找到提供与观察到的数据偏差最小的参数值。在实施例中,模型具有三组参数。首先,通过执行基于随机森林的软聚类来估计属于每个聚类组的概率。接下来,估计到达率和预订选择参数(即,到达预订系统的概率和预订选择概率(如果顾客到达))。最后,估计每个属性参数,诸如客人属性、旅行属性和外部因素。因为实施例包括两个不可观察的因素(即,无购买处理和聚类处理),因此实施例考虑了那些潜在因素。

在212处,实施例生成个性化的定价策略算法以最大化宾馆收益。从上述功能中提取的参数被插入到个性化的定价算法中,以确定每个客人的每种房间类型的最优价格。此外,实施例可以使用该模型来预测特定客人选择某种房间类别的概率。

除了图2的功能之外,实施例还使用确定的最佳定价来存储和更新向在线服务提供价格的数据库。这些更新可能很频繁(例如,一天或一个小时多次),并使得电子设备基于修改后的价格自动进行修改。此外,实施例可以使得宾馆被更充分地利用,从而导致在宾馆中使用附加服务。此外,实施例使优化价格通过网络发送,这使得其它计算设备/服务器根据修订后的优化价格来修改定价数据库中的价格。

实施例考虑具有K个不同价格的K个类型的宾馆房间。作为选择购买的房间的结果变量y取1,.....,K的值。对宾馆房间的需求可能会因宾馆顾客的个体属性、他们的预订渠道和房间类别特征而异。x表示影响宾馆房间的选择的所有特征。个性化需求模型是给定x的情况下的结果y。

一个具有挑战性的问题是,数据仅可用于观察到的宾馆房间的购买。如果忽略没有购买的情况,并且需求模型仅基于购买的情况,那么会由于低估价格敏感性而导致偏差。一些顾客可能因为价格高于他们愿意支付的价格而决定不购买。为了避免这种偏差,实施例通过将一天划分为由t=1,...,T表示的小的离散时间片来对顾客到达处理进行建模,在离散时间片期间最多一位顾客可能到达。时间t的到达处理被建模为伯努利(Bernoulli)分布,其中到达概率用λ表示。假定到达,那么假设顾客基于价格在预订和不预订任何宾馆房间之间做出决定。假定房间价格,在预订处理中考虑逻辑回归模型。对于不购买(不预订)的情况,可以使用代理价格,诸如每个房间在一天的平均价格。

假定在到达之后预订,客人可以在给定任何条件下根据其自己的偏好在K个不同房间当中选择房间。例如,需求取决于客人属性,诸如忠诚度状态、个人资料偏好、辅助服务,或者取决于外部属性,诸如当地事件、假日和天气。为了对这样的个性化需求建模,实施例首先基于信息x将客人细分为G个聚类(图2的204),使得他们的需求模式在每个聚类内是同类的,但是在聚类之间是异类的,然后在每个聚类内单独采用多项式logit模型(图2的206)。由于聚类成员身份未知,因此假设混合多项式logit模型,其中将属于每个聚类的概率指定为参数,并且然后从数据中进行估计。这被称为“选择处理”。以下个性化需求模型并入了三个顺序步骤(“需求模型步骤”):

(i)到达:r

(ii)预订:

(iii)选择:

其中

图3图示了根据一个实施例的基于属性的聚类的示例。可以基于贝叶斯信息标准(“BIC”)选择多达“聚类G”的聚类数量。聚类数量(例如,G)是先验未知的,因此需要根据数据选择G。BIC用于确定聚类数量,并且是在高斯分布假设下用于选择混合分量的数量的一致且高效的标准。这些属性可以被划分为客人属性、旅行属性和外部因素。

图4图示了根据一个实施例的使用随机森林机器学习进行关联的聚类的另一个示例。通过选择部分变量,可以减少变量/属性之间的相关性。在实施例中,客人属性、旅行属性和外部因素是通过随机森林确定聚类处理的变量。在一个实施例中,随机森林使用自举(Bootstrap)采样实现重复的决策树。从每个决策树内的13个变量中随机选择3或4个变量。自举样本大小为500。

聚类是将数据分区为子组的处理,使得根据某种距离度量,每个组中的数据点彼此更加相似。用于聚类的随机森林使用一种算法,该算法生成近似矩阵,该近似矩阵给出样本之间距离的粗略估计。在其它实施例中可以使用用于聚类的替代方法。

图5图示了根据一个实施例的将混合MNL模型应用于每个聚类以估计需求的示例。由于顾客的需求模式在聚类之间往往不同,因此图5中所示的选择模型对于每个聚类分别遵循MNL(例如,MNL 1用于聚类1,MNL 2用于聚类2,等等)。

在分析数据时,通常假设每个观察值来自一个特定分布。但是,在实践中,假设每个样本都来自相同的分布可能过于严格。数据通常是复杂的。例如,数据可能是偏态分布的或多峰的。因此,在实施例中,混合模型用于描述数据的这种复杂的概率行为。混合模型假设每个观测值都是从G个混合分量之一生成的,并且在每个分量内都假设特定分布。在实施例中,对于不同房间类型的需求是令人感兴趣的,其被定义为类别变量并且被建模为多项式逻辑(MNL)回归模型的混合。

图6图示了根据一个实施例的完整的个性化需求模型。如图所示,并如上述需求模型步骤所述,该模型并入了到达、预订和房间选择。实施例只能观察已经预订宾馆房间的顾客。市场中的其它顾客或者从未进入系统(未到达)或者未预订房间(未预订)。这些未观察到的顾客由通常称为潜在(或未观察到)的变量描述。统计方法允许通过拟合观察到的变量的分布来估计这些变量。此外,实施例所使用的统计方法允许区分未到达顾客和未预订顾客。

具体而言,对于每个时隙t,由指示符变量b

实施例使用两个步骤来执行个性化模型(图6中所示)的模型估计。首先,使用无监督聚类方法,诸如随机森林(图5中所示)来计算属于在时间t到达并预订的每个客人的聚类g的概率π

结合EM算法,在观察所有变量时首先考虑完整似然函数是有帮助的,其通过以下给出:

然后,条件期望对数似然函数给出了由

通过如下实现EM算法找到最大化器:

对于第t次迭代,(E-步骤)对于给定的第t个更新参数,实施例计算:

其中

(M-步骤)。如下获得第(t+1)个更新参数:计算:

并且通过相对于(β

为了更新

然后,重复(E-步骤)和(M-步骤)直到满足标准。

该估计方法隐含地假设聚类G的数量是已知的。由于在实践中G是未知的,因此为给定数据选择最佳G。在一个实施例中,使用10倍交叉验证,并且选择G以最小化误分类率。BIC也可用。如果选择G=1,那么基于混合MNL模型提出的个性化需求函数是在实践中常用的经典MNL模型。换句话说,经典MNL模型是上述模型的特例。

图7图示了根据一个实施例的似然函数的示例。在图2的208处使用似然函数来消除不重要变量。图7中所示的似然函数将泊松(Poisson)到达处理(r

进一步结合208和变量选择,图8图示了根据实施例的变量选择算法。如图8中所示,套索惩罚函数使用10倍交叉验证来抑制不重要参数。参数是与回归模型中观察到的或潜在的每个变量对应的系数,在给定一组观察值的情况下估计这些系数来给出模型的最佳拟合。

实施例指定κ,这是套索惩罚调整参数,其使得能够选择最佳模型。注意的是,(E-步骤)与以上公开的E-步骤相同,因为惩罚的对数似然函数是加上作为不是潜在变量的参数

由于响应观察值的向量性质,在多项式逻辑回归下找到最大化器的牛顿算法可能很繁琐。为了避免这些数值复杂性,实施例使用在Friedman,J.等人的文章“Regularization paths for generalized linear models via coordinate descent”,Journal of Statistics Software,33(1),1(2010)中公开的坐标下降算法,该文章通过引用并入本文。

实施例通过形成对如上定义的对数似然函数

其中B是预订观察值的数量,C(·)是常数函数,并且

总而言之,实施例在(M-步骤)中对于k=1,…,K和g=1,…,G,如下更新(t+1)th,

(i)对于k=2,…,K,计算:

(ii)对于j=1,…,p,更新:

其中

如果z>0并且γ<|z|,那么S(z,γ)=z-γ

如果z<0并且γ<|z|,那么S(z,γ)=z+γ

否则,S(z,γ)=0。

(iii)设置k=k+1并转到(i)。

重复迭代直到满足收敛标准。

下表描述了模型中的每个变量和参数:

在如上结合图6描述的模型中的回归结构中,变量的零回归系数(=参数)暗示该变量从模型中被删除。从这个意义上讲,抑制不重要参数意味着冗余变量的回归系数为零,并且仅保留具有非零回归系数的变量。通过抑制不重要参数,实施例可以避免所谓的过拟合问题。例如,考虑宾馆预订交易的数据库,其包括预订的房间、客人的信息以及预订的日期和时间。通过使用预订的日期和时间预测其它属性,可以容易地构建将完美拟合训练集的模型。但是,该模型将不能很好地推广到新数据,因为那些过去的时间将再也不会发生。最佳的预测和拟合模型将是验证误差具有其全局最小值的模型。

此外,许多变量使模型变得复杂。令p为解释变量的数量。实施例中的模型具有1(到达处理)+2(预订处理)+(G-1)*(K-1)*(p+2),其中p是除价格之外的解释变量的数量。如果有4种不同的房间类型和3个聚类,那么需要估计的参数数量为1+2+2*3*(p+2),其中p增加。随着参数数量的增加,模型的复杂度也增加,并且基于复杂模型的预测准确度可能变差。因此,实施例通过根据简约原理去除不重要变量来选择更简单的模型。

结合212,以下定价策略算法可以用于确定个性化定价:

个性化需求模型(例如,图6)可以用于开发个性化定价策略以最大化宾馆收益。总收益将根据每种房间类型的价格而变化。在一个实施例中,可以一次改变一种房间类型的价格,并且可以绘制总收益。

作为使用生成的模型预测特定客人选择某种房间类别的概率的示例,考虑使用以下实验数据集的示例:(1)澳大利亚悉尼的市中心宾馆;(2)从2012年1月至2014年1月的2年预订数据;(3)三种不同的房间类型($$套房>$$豪华房>$$高级房);(4)两种不同的房间特征:城市景观,水景;(5)总预订数量:2,503;(6)提前平均预订天数:10.29天;(7)平均逗留时间长度:1.84天。

使用以上数据集,最佳模型为:聚类的数量(G)=2具有最低的BIC。单个MNL被用作基准,该基准未考虑无购买的情况或聚类。70%的数据用于训练,并且30%的数据用于测试。使用了以下性能度量:

性能度量:

以下是房间类型的优先顺序($$套房>$$豪华房>$$高级房):(1)豪华房-城市景观;(2)豪华房-水景;(3)套房-城市景观;(4)套房-水景;(5)高级房-城市景观;(6)高级房-水景。

图9和图10图示了本发明的使用实验数据集来预测特定客人选择某种房间类别的概率的实施例的结果。在图10中,157个系数中有64个系数被设置为零暗示对应变量已从模型中排除。实施例将LASSO方法用于变量选择。因为由于选择一些变量而不是使用所有变量来使用更简单的模型,因此可以通过避免问题过度拟合来提高预测准确度。

图11图示了根据本发明的实施例的实验研究的结果。在研究中,房间清单被显示在表1102中。在保持所有其它价格不变的情况下,高级房的价格变化,并且总收益在1104处绘出。如图所示,最大收益被确定为当高级房价格被设置为$200时。

如所公开的,实施例基于客人属性为宾馆房间提供个性化需求建模。实施例在应用基于需求选择的模型以针对不同房间特征估计每个客人聚类的价格弹性和支付意愿之前,使用机器学习基于客人属性、旅行属性和外部因素来对预订进行聚类。

实施例假设存在几种客人聚类,并且针对每种聚类拟合多项式选择模型。当那些聚类机制不可观察时,实施例使用软聚类和EM算法的组合作为估计方法。基于聚类的混合类型选择模型,实施例定义期望收益并解决优化问题来确定最优价格,这使针对每个客人的每种房间类型的期望收益最大化。

本文具体图示和/或描述了几个实施例。但是,将认识到的是,在不背离本发明的精神和预期范围的情况下,以上教导涵盖了所公开的实施例的修改和变化,并且这些修改和变化在所附权利要求的范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号