首页> 中国专利> 一种基于人工智能的企业物资分类目录构建方法

一种基于人工智能的企业物资分类目录构建方法

摘要

本发明提供一种基于人工智能的企业物资分类目录构建方法,本发明运用人工智能技术对企业所需进行分类的企业物资和相关的外部信息进行影像特征抽取或文本信息抽取,获得图像识别模型或文本分类模型,完整地掌握内部设备物资的构造、工作原理和所属类别等信息,通过聚类并对聚类所得标签进行建模,将企业现有的设备物资分类关联并建立目录,能快速、准确且全面地与外部相关信息联系,自动进行去重和规范化,最终通过人工审核环节确认,形成企业设备物资完整目录,避免在目录的整理过程中出现重复。

著录项

  • 公开/公告号CN112200212A

    专利类型发明专利

  • 公开/公告日2021-01-08

    原文格式PDF

  • 申请/专利权人 广州市自来水有限公司;

    申请/专利号CN202010827862.7

  • 发明设计人 李骆翩;邓昆;陈光;

    申请日2020-08-17

  • 分类号G06K9/62(20060101);G06F16/35(20190101);G06N3/04(20060101);G06F40/137(20200101);G06Q10/08(20120101);

  • 代理机构44476 广州浩泰知识产权代理有限公司;

  • 代理人陈明月

  • 地址 510600 广东省广州市越秀区中山一路12号

  • 入库时间 2023-06-19 09:29:07

说明书

技术领域

本发明属于企业物资分类技术领域,具体涉及一种基于人工智能的企业物资分类目录构建方法。

背景技术

目前企业在用设备和物资管理系统大多为传统的MIS,处于实现业务流程电子化,取代传统纸质单据的阶段,虽然与传统的纸质单据的管理方式相比,MIS 更便于对录入目录所在位置的查找与传输,但仍缺乏智能化,管理人员的技术水平和对业务的了解程度有限,会容易因不清楚各个企业内部设备物资的构造、工作原理和所属类别等信息,不能快速、准确且全面地与外部相关信息联系,导致在目录的整理过程中,工作效率较低且容易出现错漏和重复。

发明内容

因此,为克服上述技术问题,本发明提供一种基于人工智能的企业物资分类目录构建方法,其特征在于,包括:

S1:采集企业内部设备物资信息,并将所采集的企业内部设备物资信息储存为计算机文档,合法合规地采集与企业内部设备物资信息相关的外部信息并建立数据库对所采集的外部信息进行储存;

S2:运用人工智能技术对步骤S1中的计算机文档及数据库进行影像特征抽取或文本信息抽取,并分别获得图像识别模型或文本分类模型并存档;

S3:对计算机文档及数据库中的图像识别模型或文本分类模型进行聚类,得到聚类标签并存档;

S4:根据聚类标签进行建模,将企业现有的设备物资分类关联并建立目录;

S5:自动进行去重,最终通过人工审核环节确认,形成企业设备物资完整目录。

进一步地,步骤S2中的影像特征抽取的步骤依次包括:步骤(1):读取设备物资影像文件;步骤(2):图像预处理;步骤(3):调用人工智能图像识别算法对步骤(2)所得的图像预处理结果进行训练,抽取特征。

进一步地,所述人工智能图像识别算法为ResNet或InceptionNet。

进一步地,步骤S2中的文本信息抽取的步骤依次包括:步骤(1):读取设备物资文本文件;步骤(2):文本预处理,如分词、词性标注、指代消歧、去停用词、关键词抽取、命名实体识别、语义角色标注、词向量与词嵌入;步骤(3):调用人工智能文本分类算法对步骤(2)所得的文本预处理结果进行训练。

进一步地,所述人工智能文本分类算法为LSTM、RCNN或BERT。

进一步地,步骤S3中的对图像识别模型进行聚类的步骤包括:步骤(1):读取图像识别模型文档;步骤(2):图像预处理;步骤(3):调用聚类算法,聚类算法是K-Means,对步骤(2)所得的图像预处理结果进行聚类;步骤(4):人工审核聚类结果,建立聚类标签和说明并关联到设备物资名称后存档;

步骤S3中的对文本分类模型进行聚类的步骤包括:步骤(1):读取文本分类模型;步骤(2):文本预处理;步骤(3):调用聚类算法,聚类算法是K-Means 或DBSCAN,对步骤(2)所得的文本预处理结果进行聚类;步骤(4):人工审核聚类结果,建立聚类标签和说明并关联到设备物资名称,并存档。

进一步地,步骤S4的具体步骤:步骤(1):采集和整理设备物资备选目录信息,包括企业现有设备物资目录、国家标准的相关目录、电商网站目录以及上一步获得的聚类标签;步骤(2):综合分析和参考所述备选目录信息,人工审核并形成初步目录,建立与所述备选目录的层级关联关系并保存;步骤(3):根据设备物资在所述备选目录中的位置,以及步骤(2)的关联关系,将每一项设备物资放置于新建树状目录的最下层子目录中,如遇到多个备选目录,则保存起来留待人工审核决定;步骤(4):人工审核和决定每一项设备物资的目录分类,并继续调整新建目录树的层级关系,形成企业设备物资新目录。

进一步地,初步目录为树状。

进一步地,步骤S5的具体步骤:步骤(1):遍历新目录中每一项设备资产,根据图像识别模型和文本分类模型计算相似度,形成疑似重复项清单;步骤(2):人工审核重复项清单,确认是否存在重复项,并对相关信息进行规范化;步骤(3):根据人工审核结果,对整个目录树进行去重和规范化,形成企业设备物资完整目录;步骤(4):根据完整目录,更新与上述备选目录的层级关联关系并保存。

进一步地,步骤S5之后还包括:

S6:如果设备物资信息需要增加,则执行S7,如果设备物资信息无需增加,则结束;S7:管理人员在操作界面输入设备物资信息,设备物资信息可为电商网站对应名称、描述和图片,或者现场拍照所得拍照;S8:运用人工智能技术对步骤S7中的设备物资信息进行影像特征抽取或文本信息抽取,获得图像识别模型或文本分类模型;S9:将所抽取的图像识别模型或文本分类模型与S5所得的企业设备物资完整目录的设备物资信息进行匹配和识别;S10:如匹配到企业设备物资完整目录中的设备物资,则进行步骤S11,如未能匹配当前企业设备物资完整目录中任何设备物资,则执行步骤S12;S11:向操作界面返回匹配结果,供管理人员选择,随后执行S14;S12:如未能匹配当前企业设备物资完整目录中任何设备物资,则管理人员根据输入的设备物资信息,采集外部信息并补充至S1中的数据库,例如电商网站的相关信息、政府网站公开信息等,随后执行 S13;S13:调用人工智能模型算法,计算与企业设备物资完整目录各类别或设备物资的匹配度和可能性,随后执行S11;S14:管理人员选择其中一项后,系统记录相关数据,随后返回步骤S3。

进一步地,步骤S9的具体步骤:步骤(1):将所抽取的图像识别模型或文本分类模型与S2的图像识别模型或文本分类模型进行匹配和识别,返回匹配度大于0.7的设备物资;步骤(2):将步骤(1)的设备物资列表组合排序后得到匹配结果。

进一步地,步骤S13的具体步骤:步骤(1):将所抽取的图像识别模型或文本分类模型与S2所得的图像识别模型和文本分类模型,返回匹配度最高的三个子目录;步骤(3):如有国标目录或电商目录等信息,调用备选目录与企业目录的关联关系进行匹配,返回匹配度最高的三个子目录,随后执行步骤(4),如果没有,直接执行步骤(4);步骤(4):将步骤(1)与步骤(2)所得子目录列表组合排序后返回。

本发明产生的有益效果是:本发明运用人工智能技术对企业所需进行分类的企业物资和相关的外部信息进行影像特征抽取或文本信息抽取,获得图像识别模型或文本分类模型,完整地掌握内部设备物资的构造、工作原理和所属类别等信息,通过聚类并对聚类所得标签进行建模,将企业现有的设备物资分类关联并建立目录,能快速、准确且全面地与外部相关信息联系,自动进行去重和规范化,最终通过人工审核环节确认,形成企业设备物资完整目录,避免在目录的整理过程中出现重复。

具体实施方式

下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

下面将描述本发明的具体实施方式。

本实施例提供的一种一种基于人工智能的企业物资分类目录构建方法,其特征在于,包括:

S1:采集企业内部设备物资信息,并将所采集的企业内部设备物资信息储存为计算机文档,合法合规地采集与企业内部设备物资信息相关的外部信息并建立数据库对所采集的外部信息进行储存;

S2:运用人工智能技术对步骤S1中的计算机文档及数据库进行影像特征抽取或文本信息抽取,并分别获得图像识别模型或文本分类模型并存档;

S3:对计算机文档及数据库中的图像识别模型或文本分类模型进行聚类,得到聚类标签并存档;

S4:根据聚类标签进行建模,将企业现有的设备物资分类关联并建立目录;

S5:自动进行去重,最终通过人工审核环节确认,形成企业设备物资完整目录。

步骤S2中的影像特征抽取的步骤依次包括:步骤(1):读取设备物资影像文件;步骤(2):图像预处理;步骤(3):调用人工智能图像识别算法对步骤(2)所得的图像预处理结果进行训练,抽取特征。

所述人工智能图像识别算法为ResNet或InceptionNet。

步骤S2中的文本信息抽取的步骤依次包括:步骤(1):读取设备物资文本文件;步骤(2):文本预处理,如分词、词性标注、指代消歧、去停用词、关键词抽取、命名实体识别、语义角色标注、词向量与词嵌入;步骤(3):调用人工智能文本分类算法对步骤(2)所得的文本预处理结果进行训练。

所述人工智能文本分类算法为LSTM、RCNN或BERT。

步骤S3中的对图像识别模型进行聚类的步骤包括:步骤(1):读取图像识别模型文档;步骤(2):图像预处理;步骤(3):调用聚类算法,聚类算法是K-Means,对步骤(2)所得的图像预处理结果进行聚类;步骤(4):人工审核聚类结果,建立聚类标签和说明并关联到设备物资名称后存档;

步骤S3中的对文本分类模型进行聚类的步骤包括:步骤(1):读取文本分类模型;步骤(2):文本预处理;步骤(3):调用聚类算法,聚类算法是 K-Means或DBSCAN,对步骤(2)所得的文本预处理结果进行聚类;步骤(4):人工审核聚类结果,建立聚类标签和说明并关联到设备物资名称后存档。

步骤S4的具体步骤:步骤(1):采集和整理设备物资备选目录信息,包括企业现有设备物资目录、国家标准的相关目录、电商网站目录以及上一步获得的聚类标签;步骤(2):综合分析和参考所述备选目录信息,人工审核并形成初步目录,建立与所述备选目录的层级关联关系并保存;步骤(3):根据设备物资在所述备选目录中的位置,以及步骤(2)的关联关系,将每一项设备物资放置于新建树状目录的最下层子目录中,如遇到多个备选目录,则保存起来留待人工审核决定;步骤(4):人工审核和决定每一项设备物资的目录分类,并继续调整新建目录树的层级关系,形成企业设备物资新目录。

初步目录为树状。

步骤S5的具体步骤:步骤(1):遍历新目录中每一项设备资产,根据图像识别模型和文本分类模型计算相似度,形成疑似重复项清单;步骤(2):人工审核重复项清单,确认是否存在重复项,并对相关信息进行规范化;步骤(3):根据人工审核结果,对整个目录树进行去重和规范化,形成企业设备物资完整目录;步骤(4):根据完整目录,更新与上述备选目录的层级关联关系并保存。

步骤S5之后还包括:

S6:如果设备物资信息需要增加,则执行S7,如果设备物资信息无需增加,则结束;S7:管理人员在操作界面输入设备物资信息,设备物资信息可为电商网站对应名称、描述和图片,或者现场拍照所得拍照;S8:运用人工智能技术对步骤S7中的设备物资信息进行影像特征抽取或文本信息抽取,获得图像识别模型或文本分类模型;S9:将所抽取的图像识别模型或文本分类模型与S5所得的企业设备物资完整目录的设备物资信息进行匹配和识别;S10:如匹配到企业设备物资完整目录中的设备物资,则进行步骤S11,如未能匹配当前企业设备物资完整目录中任何设备物资,则执行步骤S12;S11:向操作界面返回匹配结果,供管理人员选择,随后执行S14;S12:如未能匹配当前企业设备物资完整目录中任何设备物资,则管理人员根据输入的设备物资信息,采集外部信息并补充至S1中的数据库,例如电商网站的相关信息、政府网站公开信息等,随后执行 S13;S13:调用人工智能模型算法,计算与企业设备物资完整目录各类别或设备物资的匹配度和可能性,随后执行S11;S14:管理人员选择其中一项后,系统记录相关数据,随后返回步骤S3。

步骤S9的具体步骤:步骤(1):将所抽取的图像识别模型或文本分类模型与S2的图像识别模型或文本分类模型进行匹配和识别,返回匹配度大于0.7 的设备物资;步骤(2):将步骤(1)的设备物资列表组合排序后得到匹配结果。

步骤S13的具体步骤:步骤(1):将所抽取的图像识别模型或文本分类模型与S2所得的图像识别模型和文本分类模型,返回匹配度最高的三个子目录;步骤(3):如有国标目录或电商目录等信息,调用备选目录与企业目录的关联关系进行匹配,返回匹配度最高的三个子目录,随后执行步骤(4),如果没有,直接执行步骤(4);步骤(4):将步骤(1)与步骤(2)所得子目录列表组合排序后返回。

需要说明的是,当元件被称为“固定于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“上”、“下”、“左”、“右”以及类似的表述只是为了说明的目的。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出简单推演或替换,都应当视为属于本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号