技术领域
本发明涉及群智感知与智能交通技术领域,具体涉及一种基于信誉的车辆群智感知节点反向组合拍卖激励优化方法。
背景技术
移动群智感知通过感知网络将感知任务发布给系统中具有信息采集设备的个人或团队,利用个体的移动设备进行数据的收集,完成感知任务的数据采集、处理和分析。车辆群智感知是将装载有多种传感器的汽车作为基本的感知单元。车辆作为收集、存储、计算和共享大量传感器数据的理想平台,更适用于大规模路网运行状态感知,如流密速、占有率等与交通安全与效率要素相关的数据获取,可以高效便捷的感知路网状态,对数据进行收集、处理、分析及应用,快速完成感知任务。
激励机制是感知平台通过一定的方式,刺激移动个体积极参与感知系统中,对感知任务数据的收集和质量把控起着积极的作用。对于城市范围内的感知系统,为了高质量地完成任务,感知平台需要雇佣大量的参与者并为其支付报酬。如何在有限的预算下激励参与者参与感知系统并高质量地完成感知任务是城市交通群智感知系统的关键问题。
近年来,对于激励方法的研究已成为群智感知的热点研究方向。合适的激励机制能够保障有足够多的用户愿意参与到群智感知系统,从而为数据质量提供保障。同时,与激励机制相关的一个问题是目前缺乏有效的定价方案。若采用传统的统一定价方案,对于参与者来说是不公平的,会在一定程度上打击优质参与者的热情甚至使其退出感知系统。另外,现有研究常常将任务分配及车辆调度与激励机制分割开来,而实际感知中,用户调度方案的好坏将直接影响平台感知任务的完成质量和用户获得的收益,因此分配调度与激励机制是需要协同考虑的。
发明内容
针对上述现有技术中的不足,本发明目的在于提供一种基于信誉的车辆群智感知节点反向组合拍卖激励优化方法,结合金钱奖励和虚拟积分奖励的混合奖励形式,在有限的预算范围内最大化系统效益。
为实现上述目的,本发明采用如下技术方案:
一种基于信誉的车辆群智感知节点反向组合拍卖激励优化方法,包括以下步骤:
S1:根据车辆群智感知场景进行数学建模,建立包括车辆成本和报酬、感知任务的时间与空间要求以及平台预算的模型;
S2:结合感知任务的时空要求、车辆的位置信息、系统的利润与预算约束,设计系统收益与车辆收益以及约束下的目标函数;
S3:选择获胜车辆执行感知任务,根据候选车辆上报的价格、车辆的信誉、预计对平台贡献等选择获胜者;
S4:选择出最终的获胜者后,通知获胜者,获胜者开始执行感知任务并上传数据,数据上传完成后,平台根据报酬支付算法对用户进行奖励;
S5:平台通过信誉评估机制对获胜者提供的数据质量进行评估,更新车辆信誉值,为下一轮拍卖提供决策依据。
进一步地,所述步骤S1中,车辆群智感知场景主要包括以下三个部分:
(1)群智感知平台发布包含特定时间与空间要求的感知任务;
(2)候选车辆上报竞标信息,平台对车辆的竞价信息进行收集;
(3)平台使用包含优胜者选择部分和报酬计算部分的激励机制,选择执行任务的优胜者并计算需要支付给优胜者的报酬;
进一步的,所述步骤S2中,对于车辆群智感知系统存在以下三个优化目标:
(1)优化目标1:任务价值直接影响平台的利润,因而要尽可能多的实现重要任务的感知,最大化平台收益;
(2)优化目标2:最小化执行感知任务的总代价,满足总支出最小;
(3)优化目标3:最小化执行任务的车辆数量,减小数据冗余;
基于上述优化目标,建立车辆群智感知系统效益最大化目标函数为:
其中,f代表总效益,取值介于0,1之间。y
进一步的,所述步骤S3中,基于车辆性能得分来确定平台的获胜者。该得分包括车辆对平台的贡献
其中,β
获胜者的选择包括两个阶段。在第一阶段,选择所有提交了信息资料且其信誉值超过阈值的车辆,这些信誉达标的车辆进入候选组。在第二阶段中,先使用贪婪方法根据优胜者的整体表现得分来不断选择优胜者,直到预算用尽或所有任务完成为止。可以分为以下步骤:
步骤S31:预设某一信誉阈值threshold,平台从所有参与者中选择信誉值
步骤S32:计算候选集合中车辆的总体性能得分,将车辆性能得分由小到大进行排序。候选车辆的性能得分越低,被选择称为优胜者的可能性越大;
步骤S33:判断候选者的出价是否在可接受的价格范围u
步骤S34:每次拍卖后,平台根据当前的任务范围动态调整下一次拍卖的最高可接受价格u
进一步地,所述步骤S4中,考虑报酬支付算法的两种情景。当预算不足时,必须保证支付金额不小于中标者的竞标价格,以维护平台的信誉。如果预算足够,平台将启动动态奖励池。使用关键支付的概念来提出支付确定算法。优胜者的关键付款包括固定付款和奖励付款。固定支付等于用户的竞标价格,奖励支付取决于用户信誉。
进一步地,所述步骤S5中,平台通过基于参与者表现的车辆信誉更新方法控制拍卖过程,使更多车辆积极参与到感知系统。该机制通过参与者上传数据的质量、参与系统的次数、参与行为表现来评估车辆信誉值。
为了使参与者在感知系统中保持积极性,将参与者的参与率与车辆声誉相结合,即将用户参与率作为衡量用户信誉的第二个因素。参与率越高,分数越高,采用分级累加制,对车辆信誉进行更新。
本发明的上述方案至少有如下的有益效果:
1、提出基于车辆信誉的反向组合拍卖激励机制,机制包含优胜者选择部分和报酬计算。通过设置虚拟积分来提高具有高信誉车辆的获胜概率,有助于高信誉用户在系统留存;将数据质量和参与率作为车辆信誉衡量指标,使车辆保持参与积极性和高质量数据贡献行为。
2、通过构建车辆群智感知场景,分析了感知平台和车辆双方效益,建立系统效益最大化模型。通过对于实施例的仿真,验证了基于车辆信誉的反向组合拍卖激励机制的单次和长期可信性,以及本激励机制在提高感知任务完成率、车辆参与水平、平台预算控制和数据质量控制等方面的优越性。
附图说明
图1为本发明方法中车辆群智感知场景示意图;
图2为基于车辆信誉的反向组合拍卖激励机制示意图;
图3为算法设计流程图。
具体实施方式
以下结合附图和实施例对本发明技术方案进行具体的说明。
S1:根据以车辆为基础的群智感知场景进行数学建模,建立包括车辆成本和报酬、感知任务的时间与空间要求以及平台预算的模型,如图1所示。
车辆群智感知场景主要包括以下三个部分:
(4)群智感知平台发布包含特定时间与空间要求的感知任务;
(5)候选车辆上报竞标信息,平台对车辆的竞价信息进行收集;
(6)平台使用包含优胜者选择部分和报酬计算部分的激励机制选择执行任务的优胜者并计算需要支付给优胜者的报酬,如图2所示。
在车辆群智感知系统中,主要是感知平台、感知任务和车辆三要素之间的博弈。假设感知平台预算为B,T={t
S2:结合感知任务的时空要求、车辆的位置信息、系统的利润与预算约束,设计系统收益与车辆收益以及约束下的目标函数。
假设有m个愿意参与感知任务的车辆V={v
(1)优化目标1:任务价值直接影响平台的利润,因而要尽可能多的实现重要任务的感知,最大化平台收益。
式中
(2)优化目标2:最小化执行感知任务的总代价,满足总支出最小。
其中,x
(3)优化目标3:最小化执行任务的车辆数量,减小数据冗余。
基于上述优化目标,建立的车辆群智感知系统效益最大化模型为:
其中,f代表总效益,取值介于0,1之间。第一个限制条件表示感知平台的任务支出不能大于任务收益;第二个条件限制了每辆车最多可执行的子任务个数为l。第三个限制条件表示车辆在任务区域行驶的时间满足任务时间窗要求。α表示利润所占比重,β表示车辆数量所占比重,α+β=1,0<ε<1。
S3:选择执行感知任务的车辆作为获胜者,根据候选车辆上传的价格、车辆的信誉、预计对平台贡献等选择获胜者。
获胜者确定问题是NP难题,为了确保激励机制的真实性,选择规则必须满足单调性,因此本发明方法基于车辆性能得分来确定平台的获胜者。每个获胜者都是根据总体性能得分反复选择的,该得分包括车辆对平台的贡献
其中,β
获胜者的选择包括两个阶段。在第一阶段,选择所有提交了其信息资料且其信誉值超过阈值的车辆,这些信誉达标的车辆进入候选组。在第二阶段中,先使用贪婪方法根据优胜者的整体表现得分来不断选择优胜者,直到预算用尽或所有任务完成为止,算法设计流程图如图3所示。
首先预设某一信誉阈值threshold,平台从所有参与者中选择信誉值
表1算法伪代码
S4:选择出最终的获胜者后,通知获胜者,获胜者开始执行感知任务并上传数据,数据上传完成后,平台根据报酬支付算法对用户进行奖励;
本发明方法考虑报酬支付算法的两种情景。当预算不足时,必须保证支付金额不小于中标者的竞标价格,以维护平台的信誉。如果预算足够,平台将启动动态奖励池,支付金额与参与者的信誉相关。参与者拥有较高的声誉,则意味着该参与者在之前的拍卖中具有良好的参与表现,并且各项数据指标基本上满足感知平台的要求。对于既有出色表现又有很高历史声誉的优胜者,理应获得比其竞标价格更高的奖励。使用关键支付的概念来提出支付确定算法。优胜者的关键付款包括固定付款和奖励付款。固定支付等于用户的竞标价格,奖励支付取决于用户信誉。参与者报酬计算方法为:
其中,k代表系统预算状态,当预算充足时,k=1,否则k=0。
预算状态与参与者竞价相关,系统判断预算状态依据仍有未分配任务时平台剩余预算是否能够支付候选车辆集合中拥有最大竞标价的车辆。当且仅当平台的预算充足且车辆在当前拍卖中上传的数据质量达到要求时,获奖者才能获得额外的奖励。
考虑到参与者重复竞标失败而退出系统和平台预算不足以支付额外奖励的情况这两种情景,采用动态奖励用于对高信誉持续落选用户进行奖励。即高信誉落选用户会获得虚拟积分奖励。累积虚拟积分
S5:平台通过信誉评估机制对获胜者提供的数据质量进行评估,更新车辆信誉值,为下一轮拍卖提供决策依据。
假设所有提交出价信息资料的参与者都遵循其声明的轨迹,平台通过基于参与者表现的车辆信誉更新方法控制拍卖过程,使更多车辆积极参与到感知系统。该机制通过参与者上传数据的质量、参与系统的次数、参与行为表现来评估车辆信誉值。数据质量由数据完整性和数据实时性加权计算求得。
(1)数据完整性:
车辆上传的轨迹数据是离散的,因此本文用车辆实际收集的数据量与按任务要求上传频率应收集的数据量之差的比值来衡量完整性,计算公式如下:
其中N′表示应收集的数据量大小。
(2)数据实时性:
通常,数据实时性是指可以在规定时间内将数据提供到平台的数量。
其中,N
数据质量的评估函数N
其中,η
为了使参与者在感知系统中保持积极性,将参与者的参与率与车辆声誉相结合,即将用户参与率作为衡量用户信誉的第二个因素。参与率是当前参与次数与拍卖总次数之比。用户参与次数决定系统的灵活度和能动性,积极的参与将赋予平台更多的选择权,从而能够以优越的性价比、良好的数据质量完成感知任务。参与率的激励函数N
其中
为了让本领域技术人员进一步了解本发明所提出的激励方法,下面结合具体实施例作详细说明。
实施例:
本实施例详细阐述了本发明所述一种基于信誉的车辆群智感知节点反向组合拍卖激励优化方法的实例,对该方法的有效性进行验证。
仿真的参数设置如表2所示。为了证明激励机制的长期有效性,在每个实验中模拟了500次拍卖。在本实施例中,为了消除真实估值对激励机制的影响,基于高斯分布,均匀分布和指数分布三个分布来设置参与者的真实成本,并对结果进行比较和分析。
表2仿真参数设置
在感知系统中,每个用户都有自己的价值感知,因此设置了不同的最小期望奖励系数以衡量参与行为。参与者将根据其奖励和声誉来调整收集数据的精确性。作为一个理性的参与者,当其信誉值下降时,为了确保将来获胜的可能性,参与者将努力提高他们的数据质量并保持较高的参与率。
为了更真实地模拟参与者的行为,本实施例制定了价格调整规则:获胜者在下一轮将有一半的可能性将价格提高10%或保留原始价格。落选用户在参加下一轮比赛时会将价格降低10%,所有参与者的竞标价格均不得低于其感知成本。
通过本实施例的仿真,可以发现随着拍卖次数的增加,本发明的激励机制可以选择高质量的车辆执行感知任务,提高任务覆盖度。随着任务数量的增加,平台需要选择更多的参与者来执行感知任务,因此总支出随之增加。本实施例比较了基于反向拍卖(RA)和基于车辆信誉的反向组合拍卖(RBRCA)的平均激励成本。RA通过top-k算法选择获胜者,根据最高性价比进行筛选,不考虑信誉、虚拟积分的影响。当实际成本呈指数分布,且平台预算为400时,与RA相比,RBRCA可以将激励成本降低57.6%,63.3%,42.9%和27.2%,以保持相同甚至更高的任务覆盖率,表明本发明的激励机制能够降低激励成本,提高参与公平性。同时模拟系统中存在恶意参与者,恶意参与者始终提供低数据质量,不会根据外界判定打分更改自己提供数据的方式,RBRCA算法中提供高质量数据的车辆获胜概率普遍较大,表明本发明的激励机制可以提高城市交通群智感知系统的数据质量。
机译: 用于确定数字信号样本之间路径的数学函数优化方法,涉及将初始种群分为几组以形成解,选择另一种群最佳解以形成第三种群
机译: 一种基于模型的在线优化方法来限制车辆的状态变量,该方法用于预测车辆的状态变量
机译: 一种基于模型的在线优化方法来限制车辆的状态变量,该方法用于预测车辆的状态变量