公开/公告号CN114693369A
专利类型发明专利
公开/公告日2022-07-01
原文格式PDF
申请/专利权人 中国电建集团贵州电力设计研究院有限公司;
申请/专利号CN202210404011.0
申请日2022-04-18
分类号G06Q30/02(2012.01);G06Q30/08(2012.01);G06Q50/06(2012.01);
代理机构贵阳中新专利商标事务所 52100;
代理人商小川
地址 550000 贵州省贵阳市高新区黔灵山路357号德福中心A6栋
入库时间 2023-06-19 16:03:19
法律状态公告日
法律状态信息
法律状态
2022-07-19
实质审查的生效 IPC(主分类):G06Q30/02 专利申请号:2022104040110 申请日:20220418
实质审查的生效
2022-07-01
公开
发明专利申请公布
技术领域
本发明属于电力工程设备材料技术领域,尤其涉及一种电力工程设备材料季度信息价差异计算系统及方法。
背景技术
在电力工程建设投资中,设备材料购置费用所占比例超过一半以上,设备材料价格随市场波动频繁,造价控制难度加大;企业往往需要根据已往的设备材料价格的招标情况定期颁布信息价,而设备材料价格招标价并不能准确反映市场当季材料的信息价,导致信息价的计算准确率差。
发明内容
本发明要解决的技术问题是:提供一种电力工程设备材料季度信息价差异计算系统及方法,以解决电力工程设备材料价格招标价并不能准确反映市场当季材料的信息价,导致信息价的计算准确率差等技术问题。
本发明技术方案:
一种电力工程设备材料季度信息价差异计算系统,包括:
设备材料合同签订明细数据库:存储每个季度关于电力工程设备材料合同签订明细数据;合同签订明细数据包括物资名称、规格型号、采购数量、计量单位、供应商、采购日期、单价及单位税额信息;与数据读取及预处理功能模块连接;
数据读取及预处理功能模块:读取一个以上季度电力工程设备材料合同签订明细数据并进行预处理,与设备材料匹配功能模块连接;
设备材料匹配功能模块:利用物资名称及规格型号创建匹配Key值,Key=物资名称+规格型号;设置匹配得分阈值,即物资名称及规格型号匹配结果得分大于阈值的视为同一设备材料,与设备材料信息价计算模块连接;
设备材料信息价计算模块:根据Key利用Levenshtein Distance算法进行设备材料匹配,将得分值大于阈值分的设备材料匹配结果计算平均价,即该季度的设备材料信息价,与设备材料差异性分析模块连接;
设备材料差异性分析模块:根据每个季度的设备材料信息价,对不同季度的设备材料信息价再次利用Levenshtein Distance算法进行匹配,统计分析不同季度信息价变化趋势得到信息价差异性。
所述预处理的方法为:利用设备材料合同签订单价及单位税额计算含税单价;利用采购数量、含税单价计算每条数据采购含税总价;删除工作服、个人生活用品、制服、办公家具及皮带材料的数据信息。
将得分值大于阈值分的设备材料匹配结果计算平均价,即该季度的设备材料信息价的方法为:利用Levenshtein Distance算法匹配后得分大于阈值的设备材料赋予相同的Key值,代表同一种设备材料;利用Pandas开源库中group()函数按照Key进行分组,调用group["平均价"]=group["价税合计(元)"].sum()/group["采购数量"].sum()计算同一种设备材料的平均价,即该季度的设备材料信息价。
据每个季度的设备材料信息价,对不同季度的设备材料信息价再次利用Levenshtein Distance算法进行匹配,统计分析不同季度信息价变化趋势得到信息价差异性的方法包括:
Step1、读取各季度电力工程设备材料信息价;
Step2、数据处理,删除不需要统计分析的数据,保持各季度设备材料信息价表头顺序、名称和数量一致;
Step3、在最新季度数据上创建匹配Key;
Step4、每一季度信息价数据利用Levenshtein Distance算法与最新季度数据进行Key匹配,得分大于阈值的认为是同一种设备材料,设置与最新季度数据Key相同的Key值;
Step5、合并各个季度信息价数据;
Step6、利用Key值进行分组,每一组即代表同一种设备材料,对组进行数据统计分析即得到设备材料变化趋势差异性。
本发明的有益效果:
本发明根据电力设备材料历史采购价格及材料规格信息建立设备材料信息价统计计算模型,提高了电网工程主要设备材料季度信息价及其差异性的准确性,提高了工程建设预算准确性,降低控制工程成本,解决了电力工程设备材料价格招标价并不能准确反映市场当季材料的信息价,导致信息价的计算准确率差等技术问题。
附图说明
图1为本发明系统组成示意图。
具体实施方式
一种电力工程设备材料季度信息价差异计算系统,包括(见图1):
设备材料合同签订明细数据库:存储每个季度关于电力工程设备材料合同签订明细数据;合同签订明细数据包括物资名称、规格型号、采购数量、计量单位、供应商、采购日期、单价及单位税额信息;与数据读取及预处理功能模块通过以太网或内部专线网络连接;
数据读取及预处理功能模块:读取一个以上季度电力工程设备材料合同签订明细数据并进行预处理,与设备材料匹配功能模块连接;
设备材料匹配功能模块:利用物资名称及规格型号创建匹配Key值,Key=物资名称+规格型号;设置匹配得分阈值,即物资名称及规格型号匹配结果得分大于阈值的视为同一设备材料,与设备材料信息价计算模块连接;
设备材料信息价计算模块:根据Key利用Levenshtein Distance算法进行设备材料匹配,将得分值大于阈值分的设备材料匹配结果计算平均价,即该季度的设备材料信息价,与设备材料差异性分析模块连接;
设备材料差异性分析模块:根据每个季度的设备材料信息价,对不同季度的设备材料信息价再次利用Levenshtein Distance算法进行匹配,统计分析不同季度信息价变化趋势得到信息价差异性。
计算方法主要包括:
步骤1、获取多个季度关于电力工程主要设备材料合同签订明细数据:合同签订明细数据应包括物资名称、规格型号、采购数量、计量单位、供应商、采购日期、单价(元)、单位税额(元)等基本信息;
步骤2、读取数据并预处理:利用Python语言Pandas开源库及Numpy开源库读取多个季度关于电力工程主要设备材料合同签订明细数据;利用设备材料合同签订单价(元)及单位税额(元)计算单价(含税);利用采购数量、单价(含税)计算每条数据采购总价(含税);删除工作服、个人生活用品、制服、办公家具、皮带等数据;
步骤3、根据物资名称及规格型号创建模糊匹配Key并设置匹配得分阈值:实际录入工作中,设备材料合同签订信息由不同编制人员录入,无法保证物资名称及规格型号完全一致,因此利用物资名称及规格型号创建匹配Key值,方便后续进行模糊匹配,Key=物资名称+规格型号;设置匹配得分阈值,既物资名称及规格型号匹配结果得分大于阈值的视为同一设备材料;
步骤4、根据Key利用Levenshtein Distance算法进行设备材料匹配,将得分值大于阈值分的设备材料匹配结果计算平均价,既该季度的设备材料信息价:根据步骤③生成的Key利用的Levenshtein Distance算法进行设备材料匹配,根据匹配结果计算该季度每一种设备材料信息价;
步骤5、不同季度设备材料信息价重复步骤3和4,计算其差异性:根据步骤3和4得出每个季度的设备材料信息价,对不同季度的设备材料信息价再次利用LevenshteinDistance算法进行匹配,统计分析不同季度信息价变化趋势,计算其差异性。
所述步骤4中Levenshtein Distance算法详细过程如下:
Levenshtein Distance又被称为编辑距离,编辑距离可以定义为将原字符串W转变成目标字符串X所必需的最少的基本操作的次数,也就是通常所说的最小代价。原字符串W和目标字符串X两个字符串间的编辑距离可以从编辑距离的匹配关系矩阵LD中得到,LD的获取方式如下所述:
假设有两个序列分别为W和X,W=w
LD
位于匹配关系矩阵中最右下角的元素d
例:设原字符串W=mean,X=ideal,则m=4,n=5,按照公式(1)和公式(2)填充匹配关系矩阵LD,所得到的关系矩阵如下表所示:
表1匹配关系矩阵
当i=1,j=1时,W
当i=1,j=2时,W
当i=1,j=3时,W
当i=1,j=4时,W
当i=1,j=5时,W
......
当i=4,j=1时,W
当i=4,j=2时,W
当i=4,j=3时,W
当i=4,j=4时,W
当i=4,j=5时,W
由表1可知,字符串W=mean和X=ideal之间的编辑距离为ld=3。
得分函数定义为:
Score=(Len(W)+Len(X)-ld)/(Len(W)+Len(X)) (3)
式中,Score即为两个字符串匹配得分,Len(W)代表字符串W的长度,由公式(3)可计算W=mean,X=ideal的匹配得分为Score=(4+5-1)/(4+5)=88.89%.
所述步骤4中将得分值大于阈值分的设备材料匹配结果计算平均价,既该季度的设备材料信息价,详细过程如下:
利用Levenshtein Distance算法匹配后得分大于阈值的设备材料赋予相同的Key值,表示代表同一种设备材料。
利用Pandas开源库中group()函数按照Key进行分组,调用group["平均价"]=group["价税合计(元)"].sum()/group["采购数量"].sum()计算同一种设备材料的平均价,即该季度的设备材料信息价。
所述步骤5中根据步骤3、4得出每个季度的设备材料信息价,对不同季度的设备材料信息价再次利用Levenshtein Distance算法进行匹配,统计分析不同季度信息价变化趋势,计算其差异性,详细过程如下:
Step1:读取各季度电力工程主要设备材料信息价;
Step2:数据处理,删除没有必要统计分析的列,保持各季度主要设备材料信息价表头顺序、名称、数量一致;
Step3:利用步骤3在最新季度数据上创建匹配Key;
Step4:每一季度信息价数据利用Levenshtein Distance算法与最新数据进行Key匹配,得分大于阈值的认为是同一种设备材料,设置与最新数据Key相同的Key值;Step3和Step4保证了每一季度信息价数据都具有相同的匹配Key,为后续分组提供便利;
Step5:合并各个季度信息价数据;
Step6:利用Key值进行分组;每一组即代表同一种设备材料,对组进行数据分析,即可分析设备材料变化趋势及其差异性。
本发明可作为电网建设项目造价系统动态管理的依据,有利于从源头控制好电网项目投资,合理确定和有效控制工程造价,提高建设预算的准确性,进而推进造价精益管理,提高公司电网项目投资效益。