首页> 中国专利> 一种物流问题影响因子分析方法和在线分析平台

一种物流问题影响因子分析方法和在线分析平台

摘要

本发明公开了一种物流问题影响因子分析方法和在线分析平台,该方法包括:获取包裹在物流网络中的明细信息,明细信息至少包括操作记录、订单信息和客诉数据;根据包裹的操作记录,构建影响因子库;根据包裹的订单信息和客诉数据,构建问题标签库;基于IV值评估方法计算影响因子库和问题标签库中因子与目标问题之间的相关性,得到因子分析结果。本方案能够提高提高因子相关性分析的效率和灵活性。

著录项

  • 公开/公告号CN116881324A

    专利类型发明专利

  • 公开/公告日2023-10-13

    原文格式PDF

  • 申请/专利权人 上海申雪供应链管理有限公司;

    申请/专利号CN202310719867.1

  • 发明设计人 王一川;

    申请日2023-06-17

  • 分类号G06F16/2458(2019.01);G06F16/27(2019.01);G06Q10/083(2023.01);

  • 代理机构北京维正专利代理有限公司 11508;

  • 代理人陈永军

  • 地址 201700 上海市青浦区重固镇赵重公路2778弄26号201室

  • 入库时间 2024-04-18 19:44:28

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-10-31

    实质审查的生效 IPC(主分类):G06F16/2458 专利申请号:2023107198671 申请日:20230617

    实质审查的生效

说明书

技术领域

本发明涉及物流大数据技术领域,具体涉及一种物流问题影响因子分析方法和在线分析平台。

背景技术

在物流行业激烈的竞争中,各快递公司为了赢得市场和用户,一直在致力于提升物流体验。物流体验包含很多方面,大致可以分为时效和质量两类,时效关注包裹送达时间的及时性和确定性,质量关注包裹在运送过程中是否会出现破损、遗失等问题。

物流运作过程中受到多个环节多个因素的影响,且供应链中业务节点与各信息系统数据关联性和协同交互关系不明确,如何确定影响物流效率的因素及其重要程度,是目前亟需解决的技术问题。

在传统的运营行为中,问题治理一般需要业务侧的运营专家或一线管理人员依赖其个人的丰富经验提出可能需要关注的环节,归纳出需要的数据口径;技术人员根据业务提出的需求排期进行数据开发;业务拿到分析数据后可以决策是否要针对某个环节进行治理以及具体的实施方案。这种问题分析决策过程存在较大的局限性、技术侧开发成本高,缺少对不同分析路径的对比能力,给业务提供决策的数据维度不够丰富。基于上述缺点,问题分析变成一件高门槛、高成本、低收益的事情。

随着大数据技术的应用普及,通过智能化收集、集成、处理快递采购、运输、包装、装卸搬运、配送、信息服务等各个环节的信息,可以实现全面的快递大数据分析。现有技术中申请公布号为CN115564216A的中国专利文件公开了一种烟草行业物流供应链关键节点的确定方法,其中包括:获取烟草行业物流供应链业务流和数据流并进行数据分析;识别关键业务节点和相关因子;确定供应链关键节点和影响因子,并确定相应的影响因子的权重。该方案为提高物流供应链效率确定了合理的方向和方法,但是该方案并不能保证相关影响因子分析的全面性和实时性,分析路径的灵活性不足,无法提供可视化数据下钻功能。

发明内容

鉴于上述问题,本发明提出一种克服上述问题或者至少部分地解决上述问题的一种物流问题影响因子分析方法,以包裹为分析粒度,获取包裹的明细信息能够将物流网络中各个实体之间建立关联关系,获取订单信息、客诉数据等大量反映包裹流通过程中涉及的各个领域的信息,能够提高影响因子库和问题标签库构建的全面性和通用性;在进行因子相关性分析的过程中能够实时统计不同因子取值对应的标签正负样本数据,通过自定义调整分析路径实时计算得到分析结果,能够提高因子相关性分析的效率和灵活性。

根据本发明的第一方面,提供一种物流问题影响因子分析方法,包括:获取包裹在物流网络中的明细信息,明细信息至少包括操作记录、订单信息和客诉数据;根据包裹的操作记录,构建影响因子库;根据包裹的订单信息和客诉数据,构建问题标签库;基于IV值评估方法计算影响因子库和问题标签库中因子与目标问题之间的相关性,得到因子分析结果。

可选地,在本发明提供的物流问题影响因子分析方法中,获取包裹在物流网络中的操作记录、订单信息和客诉数据,物流网络包括操作实体和流转实体,操作实体包括承包区域、转运中心、独立网点,流转实体包括操作设备、操作人员、车辆、包装,订单信息包括商家id、客户id、收件地址、发件地址、收件时间、发件时间,客诉数据包括客户投诉信息、包裹问题记录、理赔工单。

可选地,在本发明提供的物流问题影响因子分析方法中,基于包裹的在物流网络中操作记录,构建物流网络中的不同实体之间的关联关系;根据业务知识获取具有业务含义的因子;根据不同实体之间的关联关系和具有业务含义的因子构建影响因子库。

可选地,在本发明提供的物流问题影响因子分析方法中,根据包裹订单信息中的收货时间和发货时间判断包裹是否存在延时问题;根据包裹的客诉数据判断包裹是否存在包括遗失、破损、问题件、投诉问题;若包裹的某个问题项存在则打标签为1,若某个问题项不存在则打标签为0,得到每个包裹的问题标签库。

可选地,在本发明提供的物流问题影响因子分析方法中,统计影响因子库中对应问题项标签为1的包裹在不同因子取值下的数量,作为坏样本数量;统计影响因子库库中对应问题项标签为0的包裹在不同因子取值下的数量,作为好样本数量;基于下述公式计算因子与目标问题之间的IV值:

bad

good

可选地,在本发明提供的物流问题影响因子分析方法中,预先设置目标问题、影响因子库中的分析数据范围和分析路径;根据预设的分析数据范围将构建的影响因子库同步到clickhouse数据库引擎,形成物化视图;基于SQL语句沿着分析路径逐层计算预设目标问题与物化视图中因子之间的相关性。

根据本发明的第二方面,提供了一种物流问题影响因子在线分析平台,包括客户端、clickhouse数据库管理系统和ODPS离线数据库,ODPS离线数据库用于对包裹的明细信息进行数据处理和分析生成影响因子库和问题标签库,并将生成的影响因子库和问题标签库同步到clickhouse数据库管理系统;clickhouse数据库管理系统用于将影响因子库中的因子按照包含关系和关联关系构建物化视图,并沿预设的分析路径逐层计算预设目标问题和物化视图中因子之间的IV值;客户端用于实时显示沿下钻路径的IV值排序结果。

可选地,在上述物流问题影响因子在线分析平台中,clickhouse数据库引擎用于对ODPS离线数据库中影响因子库的因子和问题标签库中的问题预先计算IV值,并将预先计算的IV值存储至缓存中。

根据本发明的第三方面,提供一种计算设备,包括:至少一个处理器;和存储有程序指令的存储器,其中,程序指令被配置为适于由至少一个处理器执行,程序指令包括用于执行上述物流问题影响因子分析方法的指令。

根据本发明的第四方面,提供一种存储有程序指令的可读存储介质,当程序指令被计算设备读取并执行时,使得计算设备执行上述的物流问题影响因子分析方法。

根据本发明提供的物流问题影响因子分析方法,以包裹为分析粒度,获取包裹的明细信息能够将物流网络中各个实体之间建立关联关系,获取订单信息、客诉数据等大量反映包裹流通过程中涉及的各个领域的信息,能够提高影响因子库和问题标签库构建的全面性和通用性。

通过本发明提供的物流问题影响因子在线分析平台,在进行因子相关性分析的过程中基于clickhouse数据库引擎能够实时统计不同因子取值对应的标签正负样本数据,通过自定义调整分析路径实时计算得到分析结果,能够提高因子相关性分析的效率和灵活性。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了根据本发明一个实施例的计算设备100的结构图;

图2示出了根据本发明一个实施例的物流问题影响因子分析方法200的流程示意图;

图3示出了根据本发明一个实施例的物流问题影响因子在线分析平台的系统架构示意图;

图4示出了根据本发明一个实施例的下钻路径示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

在互联网推动下物流行业得到了快速发展,传统物流的效能越来越难以在市场中获得持久的竞争力,物流产业数字化、智能化已成了必然趋势。

通过物流大数据分析可以提高运输和配送效率,降低物流成本,更有效的满足客户服务要求。物流大数据将货物流通数据、物快递公司、供求双方有效结合,形成一个巨大的即时信息平台。

为了对影响物流时效和质量问题的相关因子进行实时分析,本方案提供了一种物流问题影响因子分析方法,以包裹为分析粒度构建覆盖整个物流网络的影响因子库和问题标签库,基于Clickhouse数据引擎实现在线因子相关性分析,能够提高因子相关性分析的效率和灵活性。

图1示出了根据本发明一个实施例的计算设备100的结构图。如图1所示,在基本的配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。

取决于期望的配置,处理器104可以是任何类型的处理器,包括但不限于:微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用,或者在一些实现中,存储器控制器118可以是处理器104的一个内部部分。

取决于期望的配置,系统存储器106可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。计算设备中的物理内存通常指的是易失性存储器RAM,磁盘中的数据需要加载至物理内存中才能够被处理器104读取。系统存储器106可以包括操作系统120、一个或者多个应用122以及程序数据124。

在一些实施方式中,应用122可以布置为在操作系统上由一个或多个处理器104利用程序数据124执行指令。操作系统120例如可以是Linux、Windows等,其包括用于处理基本系统服务以及执行依赖于硬件的任务的程序指令。应用122包括用于实现各种用户期望的功能的程序指令,应用122例如可以是浏览器、即时通讯软件、软件开发工具(例如集成开发环境IDE、编译器等)等,但不限于此。当应用122被安装到计算设备100中时,可以向操作系统120添加驱动模块。

在计算设备100启动运行时,处理器104会从存储器106中读取操作系统120的程序指令并执行。应用122运行在操作系统120之上,利用操作系统120以及底层硬件提供的接口来实现各种用户期望的功能。当用户启动应用122时,应用122会加载至存储器106中,处理器104从存储器106中读取并执行应用122的程序指令。

计算设备100还包括储存设备132,储存设备132包括可移除储存器136和不可移除储存器138,可移除储存器136和不可移除储存器138均与储存接口总线134连接。

计算设备100还可以包括有助于从各种接口设备(例如,输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个A/V端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156,它们可以被配置为有助于经由一个或者多个I/O端口158和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160,其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。

网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。在根据本发明的计算设备100中,应用122包括用于执行本发明的物流问题影响因子分析方法200的指令。

因子分析法是一种将多种相关原始变量通过研究内部依赖关系概括出少数几个能突出数据信息的综合因子,对于物流时效和质量问题的治理需要进行目标问题与影响因子之间的相关性分析。

为了得到目标问题与影响因子的相关性强弱,本方案提供了一种物流问题影响因子分析方法。图2示出了根据本发明一个实施例的物流问题影响因子分析方法200的流程示意图。如图2所示,该方法200始于步骤S210,获取包裹在物流网络中的明细信息,明细信息至少包括操作记录、订单信息和客诉数据。

其中,物流网络包括线路和节点,可以按照层次进行划分,例如包括配送中心或转运中心、独立网点、承包区等操作机构实体,操作设备、操作员工、车辆、包装、件等流转实体。包裹的订单信息包括商家id、客户id、收件地址、发件地址、收件时间、发件时间等,订单信息对应的客诉数据包括客户投诉信息、包裹问题记录、理赔工单等。

每个实体都有自己的一个或多个属性,比如设备有类型属性,车辆有班次、车牌号等属性,包装有重量、体积属性等。实体与实体之间可以通过包裹的操作记录等信息建立关联关系,例如,某个包裹在某转运中心的某交叉带设备上进行了装载到某车辆的操作。可以将转运中心、交叉带设备、某车辆之间建立关联关系。

将包裹作为物流问题影响因子的分析粒度,可以有效地将整个物流网络中的各种信息整合贯穿,并且大部分时效和质量问题也都可以细化到一个包裹携带的信息中。

随后执行步骤S220,根据包裹的操作记录,构建影响因子库。

根据一个包裹的操作记录中途径的路由、节点、设备、操作人员、车辆、包装等各环节信息,构建物流网络中的不同实体之间的关联关系。

除了直接取到的数据因子,还根据业务知识在原始数据基础上加工了一批具备丰富业务含义的因子,比如利用包裹沿途经过每个转运中心时是散件形式还是包内件形式可以得到包裹集包状态因子。

根据不同实体之间的关联关系和具有业务含义的因子构建影响因子库。这些因子反映了包裹整个生命历程涉及到的各个领域的信息,不一定明确与某个具体的问题场景强相关,但都是可以参与后续分析的。根据本发明的一个实施例,以包裹粒度构建的影响因子库构成了一个不针对特定场景的包含400多个影响因子的通用因子库。

接着执行步骤S230,根据包裹的订单信息和客诉数据,构建问题标签库。

其中,包裹的配送时效和质量问题可以直接细化到每个包裹是否存在问题,例如时效不达标问题可以具体到每个包裹的揽收到签收之间的时长是否达标,遗失问题可以具体到每个包裹是否发生遗失。可以根据包裹订单信息中的收货时间和发货时间判断包裹是否存在延时问题;根据包裹的客诉数据判断包裹是否存在包括遗失、破损、问题件、投诉等具体超过100项的问题。

然后,将包裹遗失、破损、延误、投诉、问题件等多个具体问题进行打标签,若包裹的某个问题项存在则打标签为1,若某个问题项不存在则打标签为0,得到每个包裹的问题标签库。

最后执行步骤S240,基于IV值评估方法计算影响因子库和问题标签库中因子与目标问题之间的相关性,得到因子分析结果。

其中,IV值(information value,信息价值)可以表明某因子预测某问题标签能力的强弱,IV值的大小决定了自变量因子对目标问题的影响程度。

例如,给定某一特征类别Y的一个属性Y=y

其中,bad

good

根据本发明的一个实施例,可以统计影响因子库中对应问题项标签为1的包裹在不同因子取值下的数量,作为上述公式中的坏样本数量bad

在大规模数据集中,可以使用clickhouse实时大数据分析引擎本身自带的分位数或排序函数对因子变量进行分箱处理后计算IV值。计算IV值的SQL代码实现如下:

上述SQL代码中,input_table是影响因子库所在的表,label_name是问题所对应的标签字段,factor是因子。利用这段SQL中的grouping set,还可以扩展因子,同时计算多个因子与问题标签的关系。

在本发明的一个实施例中,可以预先设置目标问题、影响因子库中的分析数据范围和分析路径;根据预设的分析数据范围将构建的影响因子库同步到clickhouse数据库引擎,形成物化视图;基于SQL语句沿着分析路径逐层计算预设目标问题与物化视图中因子之间的相关性。

图3示出了根据本发明一个实施例的物流问题影响因子在线分析平台系统架构示意图。如图3所示,该系统架构包括客户端、clickhouse数据库管理系统和ODPS离线数据库。

其中,ODPS离线数据库用于对包裹的明细信息进行数据处理和分析生成影响因子库和问题标签库,并将生成的影响因子库和问题标签库同步到clickhouse数据库管理系统。

clickhouse数据库管理系统用于将影响因子库中的因子按照包含关系和关联关系构建物化视图,并沿预设的分析路径逐层计算预设目标问题和物化视图中因子之间的IV值。

客户端用于实时显示沿下钻路径的IV值排序结果。

基于本发明提供的在线分析平台可以支持用户自主选择目标问题场景、影响因子库中的分析数据范围和分析路径,实时得到分析结果。

首先,基于阿里云开发数据处理服务(ODPS)将离线产出的因子标签库数据同步进入Clickhouse数据引擎。然后利用Clickhouse物化视图功能和业务知识,将相关因子分为一组,并按照包含关系和关联关系分别构建物化视图。并且将最基础的一批因子作为根节点,clickhouse数据库引擎可以对ODPS离线数据库中影响因子库的因子和问题标签库中的问题预先计算IV值,并将预先计算的IV值存储至缓存中。通过提前计算和缓存,可以直接从缓存中提取IV值,减少在线计算时的计算量。

根据本发明的一个实施例,clickhouse数据库引擎可以对两个月约30-40亿数据的任意查询都可以实现秒级响应。此外,沿着分析路径逐层评估因子相关性可以实现数据下钻功能。

图4示出了根据本发明一个实施例的下钻路径示意图。如图4所示,分别以派件网点、首中心、末中心、重量段、集包状态为根节点进行数据下钻。

以派件网点与遗失问题之间的相关性计算为例,第一层可以分析遗失与派件网点的关系,挑选出遗失问题最严重的一批派件网点;第二层可以选定某个问题严重的派件网点,再分析该网点下遗失与收件区域的关系,挑选出该网点下遗失问题最严重的一批收件区域;第三层可以选定该收件区域,再分析该区域下遗失与代收驿站的关系,挑选出该区域下遗失问题最严重的代收驿站;第四层可以选定该代收驿站,再分析该代收驿站遗失与签收类型的关系,以此类推。

通过本发明提供的物流问题影响因子分析方法和在线分析平台,以包裹为分析粒度,获取包裹的明细信息能够将物流网络中各个实体之间建立关联关系,获取订单信息、客诉数据等大量反映包裹流通过程中涉及的各个领域的信息,能够提高影响因子库和问题标签库构建的全面性和通用性;

在进行因子相关性分析的过程中能够实时统计不同因子取值对应的标签正负样本数据,通过自定义调整分析路径实时计算得到分析结果,能够提高因子相关性分析的效率和灵活性,为业务决策提供丰富的数据维度,降低开发成本。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。

如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。

尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的而非限制性的,本发明的范围由所附权利要求书限定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号