首页> 中国专利> 一种基于贝叶斯网络的农贸市场日画像构建方法

一种基于贝叶斯网络的农贸市场日画像构建方法

摘要

本发明提供了一种基于贝叶斯网络的农贸市场日画像构建方法,包括步骤1、获取农贸市场数据库中农产品进货、交易和农残值检测数据,选取数据中每日的进货量、销售量、交易量、销售金额、菜品种类总数、不同菜品单价和农残检测结果作为特征变量;步骤2、对步骤1中的数据进行数据清洗和整理,删除数据中缺失特征变量个数大于3的数据,并对不在合理值范围的数据进行均值替换;步骤3、对清洗和整理完毕的数据进行特征量化;步骤4、对步骤1中选取的特征变量进行分析,根据分析结果构建农贸市场的贝叶斯网络拓扑结构;步骤5、根据步骤3中特征量化后的数据进行贝叶斯网络节点参数学习,形成农贸市场日画像。该方法能方便快捷建立农贸市场日画像。

著录项

  • 公开/公告号CN112184325A

    专利类型发明专利

  • 公开/公告日2021-01-05

    原文格式PDF

  • 申请/专利权人 国研软件股份有限公司;

    申请/专利号CN202011092396.9

  • 发明设计人 陈巧特;陈琴琴;王丙勤;应梦杰;

    申请日2020-10-13

  • 分类号G06Q30/02(20120101);G06Q50/02(20120101);G06N3/08(20060101);G06F16/9537(20190101);G06F16/215(20190101);

  • 代理机构11530 北京高航知识产权代理有限公司;

  • 代理人乔浩刚

  • 地址 315100 浙江省宁波市鄞州区鄞县大道东段1001号圣嘉大厦29层

  • 入库时间 2023-06-19 09:27:35

说明书

技术领域

本发明涉及农贸市场特征评价领域,尤其涉及一种基于贝叶斯网络的农贸市场日画像构建方法。

背景技术

随着城市化进程的加快,农贸市场的数量也在逐渐增多,其中部分农贸市场由于管理制度的不完善,导致销售的农产品物价过高、新鲜度差、存在农药残留等问题,农贸市场的整体环境被贴上各种负面标签,人们也逐渐丧失去“差”的农贸市场消费的欲望。

其次,随着基于互联网产业的线上生鲜超市的兴起,农贸市场的购买力逐渐下降,方便快捷的线上生鲜超市成为越来越多人的选择,传统的农贸市场正面临巨大的挑战。

为了对农贸市场的管理制度进行优化,提高农贸市场在人群中的可信赖度,需要对现有的各个农贸市场特征进行合理评价,建立相应的农贸市场日画像。农贸市场日画像的建立,不仅有利于满足消费者的购物需求,而且有利于改进农贸市场的管理模式,促进市场与群众构建紧密联系的社交网络,帮助政府建立新时期下的智慧农贸市场。

发明内容

鉴于上述问题,本发明的目的在于提供一种基于贝叶斯网络的农贸市场日画像构建方法,该方法能方便快速建立农贸市场日画像,便于满足消费者的购物需求和智慧农贸市场的建立。

为了实现上述目的,本发明的技术方案为:一种基于贝叶斯网络的农贸市场日画像构建方法:所述方法包括,

步骤1、获取农贸市场数据库中农产品进货、交易和农残值检测数据,选取数据中每日的进货量、销售量、交易量、销售金额、菜品种类总数、不同种类菜品单价和农残检测结果作为建模的特征变量;

步骤2、对步骤1中的数据进行数据清洗和整理,删除数据中缺失特征变量个数大于3 的数据,并对不在合理值范围的数据进行均值替换;

步骤3、对清洗和整理完毕的数据进行特征量化;

步骤4、对步骤1中选取的特征变量进行分析,根据分析结果构建农贸市场的贝叶斯网络拓扑结构;

步骤5、根据步骤3中特征量化后的数据进行贝叶斯网络节点参数学习,形成农贸市场日画像。

具体而言,采用如下步骤a1~a5获取步骤1中所述的特征变量,

步骤a1、形成农贸市场中农产品进货、交易和农残值检测数据库,从数据库中导出对应年份的数据;在本申请中,导出的数据是从2019年7月1日至2020年7月1日的,当然,数据具体需要导出哪些年份,根据实际需要决定;

步骤a2、从步骤a1中的农产品进货数据中收集农贸市场每日的进货量和菜品种类总数;

步骤a3,从步骤a1中的农产品交易数据中收集农贸市场每日的交易量、销售量、销售金额和不同种类菜品单价;

步骤a4,从步骤a1中的农产品农残值检测数据中收集农贸市场每日的农残检测结果;

步骤a5,汇总由步骤a2~a4的数据,以便后续的数据清洗和整理工作。

而对于步骤2中提到的数据清洗和整理,具体处理方式如下步骤b1~b4,

步骤b1,调取收集的农贸市场中每日的进货量、销售量、交易量、销售金额、菜品种类总数、不同种类菜品单价和农残检测结果数据;

步骤b2,删除缺失特征变量个数大于3的数据,而对缺失特征变量个数小于等于3的数据,将缺失部分采用标识符“S”代替;

步骤b3,设置各特征变量的合理值范围,并同样采用标识符“S”代替处于合理值范围之外的数据;本实施例中,优选农贸市场中每日进货量和销售量的合理值在0~100000kg,交易量和销售金额大于或者等于0,菜品种类总数为0~500,不同种类菜品单价的合理值在 0~500元/kg,其中农残检测结果大于或者等于0;

步骤b4,求解进货量、销售量、交易量、销售金额、菜品种类总数和不同种类菜品单价的各个均值,针对以上各特征变量中出现标识符“S”的部分,使用对应特征变量下的均值代替,同时,农残检测结果数据中出现标识符“S”的部分,使用数字0代替。

而对于步骤3中提到的特征量化,则具体按照如下步骤c1~c4的方式进行,

步骤c1,将经数据清洗和整理后的特征变量中的不同种类菜品单价转化成特征变量,即每日菜价水平,求出全年的蔬菜类菜品的菜品单价均值P

步骤c2,依次求出经数据清洗和整理后的特征变量中进货量、销售量、交易量、销售金额、菜品种类总数以及经步骤c1获取的特征变量每日菜价水平的最小值

步骤c3,计算分段范围,其中,

步骤c4,对于经数据清洗和整理后的特征变量中的农残检测结果,分成两个范围段,数值大于0表示不安全范围,属于该范围的特征变量数值采用数值1代替,数值等于0表示安全范围,属于该范围的特征变量数值仍采用数值0代替。

在进行了前述的各项操作后,具体按照如下步骤d1~d3的方式进行构建农贸市场的贝叶斯网络拓扑结构,

步骤d1,确定步骤1中的特征变量即交易量、销售量、农残检测结果和销售金额为待评价的特征变量,分别用T

步骤d2,确定步骤d1中的交易量、销售量、农残检测结果、销售金额、进货量、菜品种类总数以及每日菜价水平所对应的状态空间数,其中,除了特征变量农残检测结果只有“安全”和“不安全”两种状态外,其余特征变量均有“低”、“中”和“高”的三种状态;

步骤d3,分析待评价的特征变量与先验的特征变量之间的因果依赖关系,进行条件独立性分析,以完成农贸市场的贝叶斯网络拓扑结构设计,并形成有向无环图,具体如图1所示。

对应的,步骤5中提到的贝叶斯网络节点参数的学习则按照如下步骤e1~e3的方式进行:

步骤e1,初始化节点交易量、销售量、农残检测结果和销售金额的概率参数,即计算交易量、销售量、农残检测结果、销售金额每个状态空间在样本数据中出现的频率,

P(T

P(T

P(T

P(T

上式中,j表示“低”、“中”和“高”三种状态空间,k表示“安全”和“不安全”两种状态空间,P(T

步骤e2,根据联合概率公式计算节点的联合概率,其中,

节点交易量的联合概率为,

P(T

节点销售量的联合概率为,

P(T

节点农残检测结果的联合概率为,

P(T

节点销售金额的联合概率为,

P(T

步骤e3,计算节点进货量、菜品种类总数和菜价水平的概率参数,即计算进货量、菜品种类总数、每日菜价水平每个状态空间在样本数据中出现的频率,

P(V

P(V

P(V

上式中,P(V

最终,按照如下步骤f1~f5的方式进行基于贝叶斯网络的农贸市场日画像的构建,

步骤f1,收集输入至贝叶斯网络的输入样本,其中包含特征变量进货量、菜品种类总数和每日菜价水平,对输入样本进行特征量化;

步骤f2,令输入样本的的状态空间为{V

其中,交易量的不同状态空间出现的概率如下,

其中,P(T

P(V

步骤f3,以后验概率最大的形式给出特征变量交易量、销售量和农残检测结果的推断结果,即选择{P(T

{P(T

步骤f4,以后验概率最大的形式给出特征变量销售金额的推断,其中,销售金额的不同状态空间出现的概率分别如下,

其中,d表示销售量的状态空间推断结果,P(T

步骤f5,根据贝叶斯网络推断出待评价的特征变量即交易量、销售量、农残检测结果和销售金额的状态空间,再结合先验的特征变量即进货量、菜品种类总数和每日菜价水平的状态空间,最后给出农贸市场的日画像为

{

“进货量”:j1

“菜品种类总数”:j2

“每日菜价水平”:j3

“交易量”:j4

“销售量”:j5

“农残检测结果”:k

“销售金额”:j6

},其中,j1-j6中的每个为“低”、“中”和“高”中的一种,k为“安全”、“不安全”中的一种。

尽管已经示出和描述了本发明的实施例,本领域技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变形,本发明的范围由权利要求及其等同物限定。

与现有技术相比,本发明的优点在于:通过选择特征变量,对特征变量进行清洗和整理,再进行特征量化,并对特征变量进行分析,构建农贸市场的贝叶斯网络拓扑结构,结合量化后的特征变量进行贝叶斯网络节点参数学习,以此形成农贸市场日画像,方便快捷,有利于满足消费者的购物需求和农贸市场的管理模式的改进,帮助政府建立新时期下的智慧农贸市场。

附图说明

利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。

图1,为本发明一种基于贝叶斯网络的农贸市场日画像构建方法的一种示例性实施例图。

图2,为本申请的方法对应的有向无环图的一种示例性实施例图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。

本发明一种基于贝叶斯网络的农贸市场日画像构建方法包括,

步骤1、获取农贸市场数据库中农产品进货、交易和农残值检测数据,选取数据中每日的进货量、销售量、交易量、销售金额、菜品种类总数、不同种类菜品单价和农残检测结果作为建模的特征变量;

步骤2、对步骤1中的数据进行数据清洗和整理,删除数据中缺失特征变量个数大于3 的数据,并对不在合理值范围的数据进行均值替换;

步骤3、对清洗和整理完毕的数据进行特征量化;

步骤4、对步骤1中选取的特征变量进行分析,根据分析结果构建农贸市场的贝叶斯网络拓扑结构;

步骤5、根据步骤3中特征量化后的数据进行贝叶斯网络节点参数学习,形成农贸市场日画像。

具体而言,采用如下步骤a1~a5获取步骤1中所述的特征变量,

步骤a1、形成农贸市场中农产品进货、交易和农残值检测数据库,从数据库中导出对应年份的数据;在本申请中,导出的数据是从2019年7月1日至2020年7月1日的,当然,数据具体需要导出哪些年份,根据实际需要决定;

步骤a2、从步骤a1中的农产品进货数据中收集农贸市场每日的进货量和菜品种类总数;

步骤a3,从步骤a1中的农产品交易数据中收集农贸市场每日的交易量、销售量、销售金额和不同种类菜品单价;

步骤a4,从步骤a1中的农产品农残值检测数据中收集农贸市场每日的农残检测结果;

步骤a5,汇总由步骤a2~a4的数据,以便后续的数据清洗和整理工作。

而对于步骤2中提到的数据清洗和整理,具体处理方式如下步骤b1~b4,

步骤b1,调取收集的农贸市场中每日的进货量、销售量、交易量、销售金额、菜品种类总数、不同种类菜品单价和农残检测结果数据;

步骤b2,删除缺失特征变量个数大于3的数据,而对缺失特征变量个数小于等于3的数据,将缺失部分采用标识符“S”代替;

步骤b3,设置各特征变量的合理值范围,并同样采用标识符“S”代替处于合理值范围之外的数据;本实施例中,优选农贸市场中每日进货量和销售量的合理值在0~100000kg,交易量和销售金额大于或者等于0,菜品种类总数为0~500,不同种类菜品单价的合理值在 0~500元/kg,其中农残检测结果大于或者等于0;

步骤b4,求解进货量、销售量、交易量、销售金额、菜品种类总数和不同种类菜品单价的各个均值,针对以上各特征变量中出现标识符“S”的部分,使用对应特征变量下的均值代替,同时,农残检测结果数据中出现标识符“S”的部分,使用数字0代替。

而对于步骤3中提到的特征量化,则具体按照如下步骤c1~c4的方式进行,

步骤c1,将经数据清洗和整理后的特征变量中的不同种类菜品单价转化成特征变量,即每日菜价水平,求出全年的蔬菜类菜品的菜品单价均值P

步骤c2,依次求出经数据清洗和整理后的特征变量中进货量、销售量、交易量、销售金额、菜品种类总数以及经步骤c1获取的特征变量每日菜价水平的最小值

步骤c3,计算分段范围,其中,

步骤c4,对于经数据清洗和整理后的特征变量中的农残检测结果,分成两个范围段,数值大于0表示不安全范围,属于该范围的特征变量数值采用数值1代替,数值等于0表示安全范围,属于该范围的特征变量数值仍采用数值0代替。

在进行了前述的各项操作后,具体按照如下步骤d1~d3的方式进行构建农贸市场的贝叶斯网络拓扑结构,

步骤d1,确定步骤1中的特征变量即交易量、销售量、农残检测结果和销售金额为待评价的特征变量,分别用T

步骤d2,确定步骤d1中的交易量、销售量、农残检测结果、销售金额、进货量、菜品种类总数以及每日菜价水平所对应的状态空间数,其中,除了特征变量农残检测结果只有“安全”和“不安全”两种状态外,其余特征变量均有“低”、“中”和“高”的三种状态;

步骤d3,分析待评价的特征变量与先验的特征变量之间的因果依赖关系,进行条件独立性分析,以完成农贸市场的贝叶斯网络拓扑结构设计,并形成有向无环图,具体如图1所示。

对应的,步骤5中提到的贝叶斯网络节点参数的学习则按照如下步骤e1~e3的方式进行:

步骤e1,初始化节点交易量、销售量、农残检测结果和销售金额的概率参数,即计算交易量、销售量、农残检测结果、销售金额每个状态空间在样本数据中出现的频率,

P(T

P(T

P(T

P(T

上式中,j表示“低”、“中”和“高”三种状态空间,k表示“安全”和“不安全”两种状态空间,P(T

步骤e2,根据联合概率公式计算节点的联合概率,其中,

节点交易量的联合概率为,

P(T

节点销售量的联合概率为,

P(T

节点农残检测结果的联合概率为,

P(T

节点销售金额的联合概率为,

P(T

步骤e3,计算节点进货量、菜品种类总数和菜价水平的概率参数,即计算进货量、菜品种类总数、每日菜价水平每个状态空间在样本数据中出现的频率,

P(V

P(V

P(V

上式中,P(V

最终,按照如下步骤f1~f5的方式进行基于贝叶斯网络的农贸市场日画像的构建,

步骤f1,收集输入至贝叶斯网络的输入样本,其中包含特征变量进货量、菜品种类总数和每日菜价水平,对输入样本进行特征量化;

步骤f2,令输入样本的的状态空间为{V

其中,交易量的不同状态空间出现的概率如下,

其中,P(T

P(V

步骤f3,以后验概率最大的形式给出特征变量交易量、销售量和农残检测结果的推断结果,即选择{P(T

{P(T

步骤f4,以后验概率最大的形式给出特征变量销售金额的推断,其中,销售金额的不同状态空间出现的概率分别如下,

其中,d表示销售量的状态空间推断结果,P(T

步骤f5,根据贝叶斯网络推断出待评价的特征变量即交易量、销售量、农残检测结果和销售金额的状态空间,再结合先验的特征变量即进货量、菜品种类总数和每日菜价水平的状态空间,最后给出农贸市场的日画像为

{

“进货量”:j1

“菜品种类总数”:j2

“每日菜价水平”:j3

“交易量”:j4

“销售量”:j5

“农残检测结果”:k

“销售金额”:j6

},其中,j1-j6中的每个为“低”、“中”和“高”中的一种,k为“安全”、“不安全”中的一种。

尽管已经示出和描述了本发明的实施例,本领域技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变形,本发明的范围由权利要求及其等同物限定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号