技术领域
本发明涉及网络货运技术领域,尤其是指一种公路物流的运费自动审核方法及系统。
背景技术
近年来,随着国税405号文《关于开展网络平台道路货物运输企业代开增值税专用发票试点工作的通知》的实施,网络货运发票代开全面放开,网络货运经营者不仅可以为小规模纳税人代开发票,也能帮助个体户或者个体司机代开发票。为防止虚开发票等增值税问题的出现,网络货运经营者须严格审核每一个公路物流运单的运费。但由于运费是由市场环境、经济因素主导,物流的运费标准存在区域性和季节性差异,运费审核需要考虑提货地址、收货地址、季节等多方面因素。因此,如何高效地进行运费审核是网络货运领域一个具有挑战的问题。
当下运费审核的方式主要为人工审核,由网络货运平台的客服人工确认运输轨迹、查看历史运费情况来判断运费的合理性。这种方法严重依赖于客服的人为经验和主观判断,整个审核过程耗时耗力,效率低下。
发明内容
本发明要解决的技术问题是提供一种公路物流的运费自动审核方法及系统,其运用网络平台已有的历史运单数据,提出一种公路物流的运费自动审核系统及方法,建立离线模型对历史运单进行运费审核过程,从客服的人工审核转化为自动审核,运费审核效率更高。
为解决上述技术问题,本发明提供了一种公路物流的运费自动审核方法,包括以下步骤:S1、获取历史运单数据并将所述历史运单数据导入至网络货运平台,从所述网络货运中导出已进行运费审核的历史运单数据;S2、对所述网络货运平台中未进行运费审核的历史运单数据进行预处理;S3、对S2中预处理后的所述历史运单数据建立离线模型;S4、筛选出有合理运输轨迹的所述历史运单数据,调用所述离线模型,对筛选出的历史运单进行运费预测区间的计算,若历史运单的实际运费在所述运费预测区间内,则运费审核通过;反之,则运费审核不通过。
作为优选的,所述S2中,“对未进行运费审核的历史运单数据进行预处理”具体包括:获取数据集,所述数据集包括未进行运费审核的历史运单数据;检查所述数据集,并对所述数据集中的缺失值进行处理;获取每个所述历史运单的距离特征值、运输时间特征值、运费特征值和出发时间特征值,并将获取的多个特征值插入至所述数据集中;采用独热编码的方式,将所述数据集中每个历史运单的货物种类、运输天气信息和出发地省份进行依次编码。
作为优选的,“对所述数据集中的缺失值进行处理时”具体包括:获取所述数据集中每一字符列的缺失值比例;对缺失值比例小于50%的字符列进行填充以使得字符列完整;将缺失值比例超过50%的字符列从所述数据集中删去。
作为优选的,所述“对S2中预处理后的所述历史运单数据建立离线模型”,具体包括:按照预设比例,将所述数据集分为训练集与测试集两部分,并根据所述训练集中的数据,建立离线模型;设定初始离线模型参数,基于所述离线模型,使所述测试集数据在所述初始离线模型参数下运行,计算离线模型的绝对误差值以得到所述离线模型的准确度;搜寻所述离线模型的新的模型参数以替换所述初始模型参数,并得到新的离线模型;使所述测试集数据在所述新的离线模型下运行,并判断所述新的模型参数能否满足离线模型的绝对误差值指标,保存满足所述绝对误差值指标的离线模型为最优离线模型。
作为优选的,所述绝对误差值公式为:
其中,N为所述测试集中的数据个数,
作为优选的,所述离线模型包括:线性回归模型、逻辑回归模型、多项式回归模型、逐步回归模型、岭回归模型、贝叶斯回归模型、支持向量机模型或神经网络模型。
作为优选的,所述S1中还包括:导入影响运费变化的相关信息数据至网络货运平台;所述相关信息数据包括GPS数据、公路物流运价指数、区域气候值、地区海拔数据和城市发展水平数据。
作为优选的,所述S2中建立离线模型的方法为回归分析法。
一种公路物流的运费自动审核系统,其特征在于,包括数据导入模块、网络货运平台、数据预处理模块、离线建模模块及在线审核模块;所述数据导入模块与所述网络货运平台连接并将运单数据导入至所述网络货运平台;所述数据预处理模块与所述网络货运平台连接,所述数据预处理模块对导入的所述运单数据进行预处理;所述离线建模模块与所述数据预处理模块连接并对预处理后的所述运单数据建立离线模型,所述在线审核模块与所述离线建模模块连接并对所述运单数据中的运费信息进行审核。
作为优选的,所述公路物流的运费自动审核系统还包括公共平台接入模块,所述公共平台接入模块与所述数据导入模块及网络货运平台均连接;所述数据导入模块将所述公共平台接入模块中的信息上传至所述网络货运平台
本发明的上述技术方案相比现有技术具有以下优点:
1、本发明的公路物流的运费自动审核方法,利用网络平台中已有的历史运单数据建立离线模型,调用离线模型进行运费的在线自动审核;从传统的人工审核转化为自动审核,审核效率更高。
2、本发明公路物流的运费自动审核系统包括数据导入模块、网络货运平台、数据预处理模块、离线建模模块及在线审核模块,其能够实现公路物流的运费自动审核,采用模块化的设计便于后续对系统进行维护和升级。
附图说明
为了使本发明的内容更容易被清楚的理解,下面根据本发明的具体实施例并结合附图,对本发明作进一步详细的说明,其中:
图1为本发明运费自动审核方法的流程示意图;
图2为本发明运费自动审核系统的系统架构图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好地理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
参照图1~图2所示,本发明公开了一种公路物流的运费自动审核方法及系统。
其中,公路物流的运费自动审核方法包括以下步骤:
步骤一、数据导入,获取历史运单数据并将上述历史运单数据导入至网络货运平台,根据运费审核情况导出符合规定的历史运单数据。
上述历史运单数据包括但不限于提货地址、收获地址、提货时间、收货时间、运输里程、货物类型、货物重量、运输车辆类型和运费数据。运费审核情况包括但不限于待审核、审核中、审核通过、审核不通过,其中符合规定的历史运单数据为审核通过与审核不通过的历史运单数据,即为已进行运费审核的历史运单数据。
在上述步骤一中,向网络货运平台中导入影响运费变化的相关信息数据,上述相关信息数据包括而不限于GPS数据、中国公路物流运价指数、区域气候值、地区海拔数据和城市发展水平数据。
步骤二、数据预处理,对导入上述网络货运平台中未进行运费审核的历史运单数据以及其他影响运费变化的相关信息数据进行预处理。
上述数据预处理操作包括:获取数据集,数据集包括未进行运费审核的历史运单数据以及其他影响运费变化的相关信息数据。检查上述数据集,对数据集中的缺失值进行处理:获取数据集中每一字符列的缺失值比例,对缺失值比例小于50%的字符列进行填充以使得字符列完整,填充值为字符列的均值,将缺失值比例超过50%的字符列从数据集中删去。
由于数据集中存在有货物较多重量较大的运单,上述运单被拆分为多个小的运单,由于这些运单的出发地和目的地相同,且运费差异较小,因此只保留其中一个小的运单的数据以实现减少数据集中的重复数据。
获取每个历史运单的距离特征值、运输时间特征值、运费特征值和出发时间特征值,并将获取的多个特征值插入至数据集中。具体地,距离特征的获取方法为:选取运单的出发地与目的地的经纬度,调用距离计算函数,计算出两地之间的距离,生成距离特征值。运输时间特征值的获取方法为:选取运单的发出时间和送达时间,计算得出运输时间,生成运输时间特征值。运费特征值的获取方法为:根据公式单价元/吨公里=运费/元重量/吨距离/公里,计算出运费单价,并选择运费单价在0.1-50之间的数据生成新的数据集。
采用独热编码的方式,将数据集中每个历史运单的货物种类、运输天气信息和出发地省份进行依次编码。根据运单的发出时间,将运单发出时间的月份与日分离出来,作为单独的列插入上述数据集中。
进一步地,对各个特征进行相关性分析,减少多重共线性的影响。
步骤三、对步骤二中预处理后的数据建立离线模型,建立离线模型的方法为回归分析法。其中,建立离线模型具体包括以下步骤:(1)按照预设比例,选择运费特征以及与运费特征相关性较大的特征(如运输距离,货物重量,车型,出发日期,出发省份等),将数据集拆分为训练集与测试集两部分,并根据训练集中的数据,建立离线模型。(2)设定初始离线模型参数,基于离线模型,使测试集数据在初始离线模型参数下运行,计算离线模型的绝对误差值,并利用评价指标评估上述离线模型的准确度。评价指标包括但不限于平均绝对误差、平均绝对百分比误差、均方误差、均方误差对数、中位绝对误差、R平方系数。(3)搜寻上述离线模型的新的模型参数以替换初始模型参数,并得到新的离线模型;使测试集数据在新的离线模型下运行,并判断新的模型参数能否满足离线模型的绝对误差值指标,保存满足绝对误差值指标的离线模型为最优离线模型。
具体地,绝对误差值公式为:
其中,N为所述测试集中的数据个数,
进一步地,上述离线模型包括但不限于线性回归模型、逻辑回归模型、多项式回归模型、逐步回归模型、岭回归模型、贝叶斯回归模型、支持向量机模型、神经网络模型。
步骤四、运费在线自动审核,利用距离指标计算提货和收货地址附近的轨迹情况,并根据轨迹情况筛选出未进行运费审核且有合理运输轨迹过程的历史运单数据,调用离线模型,对筛选出的历史运单进行运费预测区间的计算,若历史运单的实际运费在所述运费预测区间内,则运费审核通过;反之,则运费审核不通过。
优选的,本发明的公路物流的运费自动审核方法,利用网络平台中已有的历史运单数据建立离线模型,调用离线模型进行运费的在线自动审核;从传统的人工审核转化为自动审核,审核效率更高。
基于上述公路物流的运费自动审核方法,本发明还公开了一种公路物流的运费自动审核系统。
上述公路物流的运费自动审核系统与上文描述的公路物流的运费自动审核方法可相互对应参照。
具体地,上述公路物流的运费自动审核系统,包括数据导入模块、公共平台接入模块、网络货运平台、数据预处理模块、离线建模模块及在线审核模块。
数据导入模块与网络货运平台连接并将运单数据导入至网络货运平台;公共平台接入模块与数据导入模块及网络货运平台均连接,数据导入模块将公共平台接入模块中的信息上传至网络货运平台。
上述数据预处理模块与网络货运平台连接,数据预处理模块对导入的运单数据进行预处理。离线建模模块与数据预处理模块连接并对预处理后的运单数据建立离线模型。在线审核模块与离线建模模块连接,上述在先审核模块能够判断历史运单的运输轨迹并能够利用离线模型对运单数据中的运费信息进行审核。
本发明提出的公路物流的运费自动审核系统及方法,利用人工智能领域的回归分析法,将历史运单数据中蕴含的市场环境和经济因素引入到运费审核过程,从客服的人工审核转化为自动审核,弥补了传统运费审核在审核质量和效率上的不足。不仅考虑了运单数据,还结合了公共平台的信息数据,从而更能刻画物流运输过程的实际情况,提高网络货运平台运费的审核质量,保证平台管理流程的高速运转。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,上述实施例仅仅是为清楚地说明所作的举例,并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
机译: 运费率在线显示和公路运费指数计算的系统和方法
机译: 战略合作信息管理系统,该方法的操作方法,该介质的记录程序或滑票发行系统,运费管理系统,物流管理系统和商品管理方法
机译: 高速公路公共物流终端的物流配送方法及物流系统