首页> 中国专利> 一种跨境保税仓商品分类方法及装置

一种跨境保税仓商品分类方法及装置

摘要

本申请公开了一种跨境保税仓商品分类方法及装置,根据商品的商品信息,利用预设分词模型对商品进行分词分析,得到分词结果,再通过分词结果与预设类目关键字库的匹配结果计分,得到分词结果在每个类目中所获分数,从而得出商品所属分类的权重,进而得到商品的分类类目,利用分词与匹配并计分的自动化、科学性的方式,解决了现有的跨境商品分类存在的效率低下,商品分类固化,判断结果偏差的技术问题。

著录项

  • 公开/公告号CN112767081A

    专利类型发明专利

  • 公开/公告日2021-05-07

    原文格式PDF

  • 申请/专利权人 广州新丝路信息科技有限公司;

    申请/专利号CN202110070797.2

  • 申请日2021-01-19

  • 分类号G06Q30/06(20120101);G06Q10/08(20120101);G06F40/289(20200101);

  • 代理机构44442 广东翰锐律师事务所;

  • 代理人胡厚财

  • 地址 510000 广东省广州市南沙区龙穴大道中13号1501房之自编1510B(仅限办公)

  • 入库时间 2023-06-19 10:54:12

说明书

技术领域

本申请涉及仓库管理技术领域,尤其涉及一种跨境保税仓商品分类方法及装置。

背景技术

跨境电商进口商品在跨境供应链流通或电商销售中,需要对商品进行分类,以便于商品类目的相关统计等,但在跨境电商进口商品销售环节中,商品分类与海关的进口商品分类规则具有一定的区别。

目前,跨境电商进口商品的一般流程为:1、建立分类类目;2、以人工分类为主,将商品按照分类类目分到相应类目中,例如:新入仓的商品录入跨境保税仓库的仓库管理系统时,录入人员在仓库管理系统上选择该商品的分类类目,确认后,仓库管理系统记录该商品分类。

当前跨境商品分类主要是基于人为主观判断的方式,由于以人工决策为主,在选择商品的归属分类时,如果是已知商品或与已知相近的商品,可由预分类系统对商品进行分类,再进行人工核验,而如果是新商品或系统未知商品,则只能由人工进行判断。且如果新商品不属于现有任何类目,需要人工进行商品类目的新增处理。如果新商品超出人工的认知范围内,则还需要人工获取商品信息,通过各种搜索引擎等工具获取商品的分类信息,且每个人的认知不同,同一商品有可能会出现不同的分类结果,引发一系列业务逻辑混乱。综上所述,现有的跨境商品分类存在着效率低下,商品分类固化,判断结果偏差的技术问题。

发明内容

本申请提供了一种跨境保税仓商品分类方法及装置,解决了现有的跨境商品分类存在的效率低下,商品分类固化,判断结果偏差的技术问题。

有鉴于此,本申请第一方面提供了一种跨境保税仓商品分类方法,所述方法包括:

获取待进入跨境保税仓的商品的商品信息;

利用预设分词模型对所述商品信息进行分析,得到所述商品的分词结果;

将所述分词结果与预设类目关键字库进行匹配,根据匹配结果得到关键字的类目计分,将所述类目计分最高的关键字库所属的类目作为所述商品的分类类目。

可选地,所述将所述分词结果与预设类目关键字库进行匹配之前还包括:

构建跨境商品的至少一个类目;

构建所述类目的关键字库,所述关键字库中包括至少一个与所述类目关联的关键字;

将所述类目与所述关键字库对应关联,生成预设类目关键字库。

可选地,所述将所述分词结果与预设类目关键字库进行匹配,根据匹配结果得到关键字的类目计分,将所述类目计分最高的关键字库所属的类目作为所述商品的分类类目具体包括:

将所述分词结果的分词与预设类目关键字库的关键字进行一一匹配;

根据所述分词在所述商品信息中的位置权重,对匹配的所述关键字进行类目计分;

将所述类目计分最高的关键字库所属的类目作为所述商品的分类类目。

可选地,所述将所述分词结果与预设类目关键字库进行匹配,根据匹配结果得到关键字的类目计分,将所述类目计分最高的关键字库所属的类目作为所述商品的分类类目之后还包括:

若最高的所述类目计分低于预设阈值,则将所述商品的商品信息作为输入,利用预设商品分类神经网络模型,得到预测分类结果及其预测百分比;

将所述预测百分比最高的预测分类结果作为所述商品的最终分类类目。

可选地,还包括:

构建训练样本集,所述训练样本集中包括训练商品信息以及训练分类类目,所述训练分类类目为目标标签;

通过训练样本集对商品分类神经网络模型进行训练,得到预设商品分类神经网络模型。

可选地,所述将所述分词结果与预设类目关键字库进行匹配,根据匹配结果得到关键字的类目计分,将所述类目计分最高的关键字库所属的类目作为所述商品的分类类目之后还包括:

若最高的所述类目计分高于所述预设阈值,则将所述商品的商品信息以及所述商品的分类类目加入所述训练样本集中。

本申请第二方面提供一种跨境保税仓商品分类装置,所述装置包括:

获取单元,用于获取待进入跨境保税仓的商品的商品信息;

分析单元,用于利用预设分词模型对所述商品信息进行分析,得到所述商品的分词结果;

第一分类单元,用于将所述分词结果与预设类目关键字库进行匹配,根据匹配结果得到关键字的类目计分,将所述类目计分最高的关键字库所属的类目作为所述商品的分类类目。

可选地,还包括:

第一构建单元,用于构建跨境商品的至少一个类目;

第二构建单元,用于构建所述类目的关键字库,所述关键字库中包括至少一个与所述类目关联的关键字;

关联单元,用于将所述类目与所述关键字库对应关联,生成预设类目关键字库。

可选地,还包括:

预测单元,用于若最高的所述类目计分低于预设阈值,则将所述商品的商品信息作为输入,利用预设商品分类神经网络模型,得到预测分类结果及其预测百分比;

第二分类单元,用于将所述预测百分比最高的预测分类结果作为所述商品的最终分类类目。

可选地,还包括:

第三构建单元,用于构建训练样本集,所述训练样本集中包括训练商品信息以及训练分类类目,所述训练分类类目为目标标签;

训练单元,用于通过训练样本集对商品分类神经网络模型进行训练,得到预设商品分类神经网络模型。

从以上技术方案可以看出,本申请实施例具有以下优点:

本申请中,提供了一种跨境保税仓商品分类方法及装置,根据商品的商品信息,利用预设分词模型对商品进行分词分析,得到分词结果,再通过分词结果与预设类目关键字库的匹配结果计分,得到分词结果在每个类目中所获分数,从而得出商品所属分类的权重,进而得到商品的分类类目,利用分词与匹配并计分的自动化、科学性的方式,解决了现有的跨境商品分类存在的效率低下,商品分类固化,判断结果偏差的技术问题。

附图说明

图1为本申请实施例中一种跨境保税仓商品分类方法的一个流程示意图;

图2为本申请实施例中一种跨境保税仓商品分类方法的另一个流程示意图;

图3为本申请实施例中一种跨境保税仓商品分类装置的一个结构示意图;

图4为本申请实施例中一种跨境保税仓商品分类装置的另一个结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请设计了一种跨境保税仓商品分类方法及装置,解决了现有的跨境商品分类存在的效率低下,商品分类固化,判断结果偏差的技术问题。

为了便于理解,请参阅图1,图1为本申请实施例中一种跨境保税仓商品分类方法的第一个方法流程图,如图1所示,具体为:

101、获取待进入跨境保税仓的商品的商品信息;

需要说明的是,对于待进入跨境保税仓的商品,首先需要获取其商品信息,商品信息通常可以包括商品名称、商品成分、商品原产地、商品海关分类等信息。

102、利用预设分词模型对商品信息进行分析,得到商品的分词结果;

需要说明的是,在获取到商品信息后,利用预设分词模型将商品信息进行分词处理,完整的商品信息被拆分为单个词语,输出得到商品的分词结果,分词结果中除了包含商品的单个的分词以外,还包含每个分词在原来商品信息中的位置信息,例如商品信息中的商品名称为“某某牌针织毛线衣”,分词结果中将显示“某某牌—1-1”,“针织—1-2”,“毛线—1-3”,“衣—1-4”,其中,数字标识中的前面一位代表属于商品信息中的哪一个信息,数字标识中的后面一位代表该分词在商品信息中的第几个分词。

103、将分词结果与预设类目关键字库进行匹配,根据匹配结果得到关键字的类目计分,将类目计分最高的关键字库所属的类目作为商品的分类类目;

需要说明的是,在得到了分词结果后,需要进一步地将分词结果与预设类目关键字库进行匹配,将分词结果中的每一个分词与预设类目关键字库各个类目的关键字库逐一匹配,每个分词匹配上一个类目的关键字库中的关键字即进行对应的类目计分。最终累积类目计分最高的关键字库所属的类目即为该商品的分类类目。

本申请实施例中,提供了一种跨境保税仓商品分类方法及装置,根据商品的商品信息,利用预设分词模型对商品进行分词分析,得到分词结果,再通过分词结果与预设类目关键字库的匹配结果计分,得到分词结果在每个类目中所获分数,从而得出商品所属分类的权重,进而得到商品的分类类目,利用分词与匹配并计分的自动化、科学性的方式,解决了现有的跨境商品分类存在的效率低下,商品分类固化,判断结果偏差的技术问题。

请参阅图2,图2为本申请实施例中一种跨境保税仓商品分类方法的第二个方法流程图,如图2所示,具体为:

201、构建跨境商品的至少一个类目;

需要说明的是,在执行分词结果的匹配之前,首先需要构建跨境商品的至少一个类目,根据实际的需求,构建的类目涵盖绝大部分跨境商品的类目信息。

202、构建类目的关键字库,关键字库中包括至少一个与类目关联的关键字;

需要说明的是,根据经验来定义各个类目的常见关键字,从而构建形成类目的关键字库,例如类目为“美妆”,其对应的关键字库中可能包括“口红”、“粉饼”、“眼线笔”等关键字。

203、将类目与关键字库对应关联,生成预设类目关键字库;

需要说明的是,在依次构建了类目以及关键字库后,将类目和关键字库关联起来,生成预设类目关键字库,为后续分词的匹配做准备。

204、获取待进入跨境保税仓的商品的商品信息;

需要说明的是,对于待进入跨境保税仓的商品,首先需要获取其商品信息,商品信息通常可以包括商品名称、商品成分、商品原产地、商品海关分类等信息。

205、利用预设分词模型对商品信息进行分析,得到商品的分词结果;

需要说明的是,在获取到商品信息后,利用预设分词模型将商品信息进行分词处理,完整的商品信息被拆分为单个词语,输出得到商品的分词结果,分词结果中除了包含商品的单个的分词以外,还包含每个分词在原来商品信息中的位置信息,例如商品信息中的商品名称为“某某牌针织毛线衣”,分词结果中将显示“某某牌—1-1”,“针织—1-2”,“毛线—1-3”,“衣—1-4”,其中,数字标识中的前面一位代表属于商品信息中的哪一个信息,数字标识中的后面一位代表该分词在商品信息中的第几个分词。

206、将分词结果的分词与预设类目关键字库的关键字进行一一匹配;

需要说明的是,将得到的分词结果中的分词,与预设类目关键字库中的关键字进行一一匹配。

207、根据分词在商品信息中的位置权重,对匹配的关键字进行类目计分;

需要说明的是,分词与预设类目关键字库中的关键字进行匹配后,将根据分词结果中显示的分词所在商品信息中的位置及权重,从而对匹配的关键字进行类目计分。

208、将类目计分最高的关键字库所属的类目作为商品的分类类目。

需要说明的是,最终累积类目计分最高的关键字库所属的类目即为该商品的分类类目。

本申请实施例中,提供了一种跨境保税仓商品分类方法及装置,根据商品的商品信息,利用预设分词模型对商品进行分词分析,得到分词结果,再通过分词结果与预设类目关键字库的匹配结果计分,得到分词结果在每个类目中所获分数,从而得出商品所属分类的权重,进而得到商品的分类类目,利用分词与匹配并计分的自动化、科学性的方式,解决了现有的跨境商品分类存在的效率低下,商品分类固化,判断结果偏差的技术问题。进一步地,考虑分词在商品信息中的位置权重,更加准确关键字对商品的影响,从而提高商品分类的精确度。

请参阅图3,图3为本申请实施例中一种跨境保税仓商品分类方法的第三个方法流程图,如图3所示,具体为:

301、获取待进入跨境保税仓的商品的商品信息;

需要说明的是,对于待进入跨境保税仓的商品,首先需要获取其商品信息,商品信息通常可以包括商品名称、商品成分、商品原产地、商品海关分类等信息。

302、利用预设分词模型对商品信息进行分析,得到商品的分词结果;

需要说明的是,在获取到商品信息后,利用预设分词模型将商品信息进行分词处理,完整的商品信息被拆分为单个词语,输出得到商品的分词结果,分词结果中除了包含商品的单个的分词以外,还包含每个分词在原来商品信息中的位置信息,例如商品信息中的商品名称为“某某牌针织毛线衣”,分词结果中将显示“某某牌—1-1”,“针织—1-2”,“毛线—1-3”,“衣—1-4”,其中,数字标识中的前面一位代表属于商品信息中的哪一个信息,数字标识中的后面一位代表该分词在商品信息中的第几个分词。

303、将分词结果与预设类目关键字库进行匹配,根据匹配结果得到关键字的类目计分,将类目计分最高的关键字库所属的类目作为商品的分类类目;

需要说明的是,在得到了分词结果后,需要进一步地将分词结果与预设类目关键字库进行匹配,将分词结果中的每一个分词与预设类目关键字库各个类目的关键字库逐一匹配,每个分词匹配上一个类目的关键字库中的关键字即进行对应的类目计分。最终累积类目计分最高的关键字库所属的类目即为该商品的分类类目。

304、构建训练样本集,训练样本集中包括训练商品信息以及训练分类类目,训练分类类目为目标标签;

需要说明的是,进一步地通过构建训练样本集来进行商品分类神经网络模型进行训练,在训练样本集中包括训练商品信息以及训练分类类目,其中训练分类类目为目标标签,即通过训练商品分类神经网络模型实现商品信息与分类类目的映射。

305、通过训练样本集对商品分类神经网络模型进行训练,得到预设商品分类神经网络模型;

需要说明的是,在构建训练样本集后,对商品分类神经网络模型进行训练,得到预设商品分类神经网络模型。

306、若最高的类目计分低于预设阈值,则将商品的商品信息作为输入,利用预设商品分类神经网络模型,得到预测分类结果及其预测百分比;

需要说明的是,若最高的类目计分低于预设阈值,则代表该类目的代表性不足,需要进一步地将商品的商品信息作为输入,输入至预设商品分类神经网络模型中,通过预设商品分类神经网络得到各种预测分类结果及其预测百分比。

307、将预测百分比最高的预测分类结果作为商品的最终分类类目;

需要说明的是,预测百分比最高的预测分类结果则为该商品的最终分类类目。

308、若最高的类目计分高于预设阈值,则将商品的商品信息以及商品的分类类目加入训练样本集中。

需要说明的是,若最高的类目计分高于预设阈值,说明该分类类目具有代表性,则可以进一步地利用该商品的商品信息及分类类目作为预设商品分类神经网络的训练样本,加入训练样本集中,进一步地优化预设商品分类神经网络。

请参阅图4,图4为本申请实施例中一种跨境保税仓商品分类装置的第一个结构示意图,如图4所示,具体为:

获取单元401,用于获取待进入跨境保税仓的商品的商品信息;

分析单元402,用于利用预设分词模型对商品信息进行分析,得到商品的分词结果;

第一分类单元403,用于将分词结果与预设类目关键字库进行匹配,根据匹配结果得到关键字的类目计分,将类目计分最高的关键字库所属的类目作为商品的分类类目。

请参阅图5,图5为本申请实施例中一种跨境保税仓商品分类装置的第二个结构示意图,如图5所示,具体为:

第一构建单元501,用于构建跨境商品的至少一个类目;

第二构建单元502,用于构建类目的关键字库,关键字库中包括至少一个与类目关联的关键字;

关联单元503,用于将类目与关键字库对应关联,生成预设类目关键字库;

获取单元504,用于获取待进入跨境保税仓的商品的商品信息;

分析单元505,用于利用预设分词模型对商品信息进行分析,得到商品的分词结果;

第一分类单元506,用于将分词结果与预设类目关键字库进行匹配,根据匹配结果得到关键字的类目计分,将类目计分最高的关键字库所属的类目作为商品的分类类目。

请参阅图6,图6为本申请实施例中一种跨境保税仓商品分类装置的第三个结构示意图,如图6所示,具体为:

获取单元601,用于获取待进入跨境保税仓的商品的商品信息;

分析单元602,用于利用预设分词模型对商品信息进行分析,得到商品的分词结果;

第一分类单元603,用于将分词结果与预设类目关键字库进行匹配,根据匹配结果得到关键字的类目计分,将类目计分最高的关键字库所属的类目作为商品的分类类目;

第三构建单元604,用于构建训练样本集,训练样本集中包括训练商品信息以及训练分类类目,训练分类类目为目标标签;

训练单元605,用于通过训练样本集对商品分类神经网络模型进行训练,得到预设商品分类神经网络模型;

预测单元606,用于若最高的类目计分低于预设阈值,则将商品的商品信息作为输入,利用预设商品分类神经网络模型,得到预测分类结果及其预测百分比;

第二分类单元607,用于将预测百分比最高的预测分类结果作为商品的最终分类类目。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号