公开/公告号CN113850680A
专利类型发明专利
公开/公告日2021-12-28
原文格式PDF
申请/专利权人 广州地铁集团有限公司;
申请/专利号CN202110982865.2
申请日2021-08-25
分类号G06Q40/06(20120101);G06Q50/30(20120101);G06Q10/06(20120101);
代理机构11947 北京盛凡佳华专利代理事务所(普通合伙);
代理人靳桂琳
地址 510220 广东省广州市海珠区新港东路1238号万胜广场A座
入库时间 2023-06-19 13:26:15
法律状态公告日
法律状态信息
法律状态
2022-05-24
著录事项变更 IPC(主分类):G06Q40/06 专利申请号:2021109828652 变更事项:发明人 变更前:丁建隆谭文张志良林志元袁亮亮吴敏姚世峰曹明华周国鹏苟俊琴王斌兰闯温伟玲刘铁民陈红仙张涛朱屾肖美娜王志清赖松应 变更后:林志元曹明华周国鹏丁建隆谭文张志良陈红仙张涛王志清赖松应袁亮亮吴敏姚世峰苟俊琴王斌兰闯刘铁民朱屾肖美娜
著录事项变更
技术领域
本发明涉及轨道交通造价审计技术领域,具体为一种轨道 交通工程全生命周期工程投资水平评估方法。
背景技术
随着我国经济实力不断增强,城市化发展的步伐也在逐渐 加快,作为解决城市交通的重要手段——轨道交通建设也日益 受到高度重视。目前城市轨道交通工程建设过程中存在的主要 问题是轨道交通工程造价数据没有统一的规范,数据杂乱,不 同线路之间不能实现快速对比分析,只能人为的从不同途径获 取数据后,经过长时间的整理形成对比,这样费时费力,存在 获取数据难,耗时长,容易出现错误等问题。
发明内容
为了克服现有技术提及的缺点,本发明提供一种轨道交通 工程全生命周期工程投资水平评估方法,能够快速的实现轨道 交通不同线路、专业、阶段之间的工程造价数据的对比分析。
本发明为解决上述问题采取的方案是:一种轨道交通工程 全生命周期工程投资水平评估方法,其方法包括如下步骤:
S1.基于分布式和高并发的计算机技术,获取轨道交通工程 造价原始数据;
S2.对数据进行标准化专业编码处理及特征提取关联;
S3.计算线路工程造价数据指标,统计归集不同的费用类 型;
S4.根据需要统计分析的维度对数据进行展示。
进一步的,步骤S2中对数据进行标准化专业编码处理的步 骤如下:首先赋予标准化专业结构名称一个编码,然后把数据 跟标准化专业结构名称进行比较识别,并给予相似度匹配的数 据相同的编码。
其中,采用余弦相似度算法计算数据跟标准化专业结构名 称的文本相似度。
所述余弦相似度算法通过计算数据跟标准化专业结构名称 的两个向量的夹角余弦值来评估他们的相似度,其算法如下:
向量a=(x1,y1),
向量b=(x2,y2),
similarity=a.b/|a|*|b|a.b=x1x2+y1y2;
其中:向量a为数据,向量b为标准化专业结构名称,
得出的similarity值越大说明越相似,取相似度最大的给 予对应的编码。
进一步的,步骤S2中对数据进行特征提取关联的步骤如下: 在特征关联上,根据线路维度的特征继承到专业维度,建立特 征体系;在特征提取上,在特征体系中建立部分特征提取的规 则,并运用正则匹配或查找的方法来获取线路维度的部分特征 值。
本发明的有益效果是:本技术通过计算机快速实现数据分 类归集,对比分析,具有效率高,速度快,更精准的优点。
附图说明
图1为本发明的步骤流程框图;
图2和图3为本发明的实施例的数据展示图。
具体实施方式
下面结合附图对本发明进行进一步的说明。
如图1所示,一种轨道交通工程全生命周期工程投资水平 评估方法,其方法包括如下步骤:
S1.基于分布式和高并发的计算机技术,从线路项目总概算 或册概算获取轨道交通工程造价原始数据;
S2.对数据进行标准化专业编码处理及特征提取关联;
S3.计算线路工程造价数据指标,统计归集不同的费用类 型;其中,线路工程造价数据指标的计算方法为:数据的总造 价除以其工程量。数据单一个指标并不能代表什么,因此需要 知道该指标的特征属性,步骤S2的特征提取则是为该指标赋予 特征属性,使指标更具备意义。而编码则是为通类型的指标做 唯一标识,用于指标的统计对比分析。
S4.计算机通过步骤S2,S3里面对数据的编码及特征关联, 快速检索同类型数据进行对比分析。即取同编码的数据做一类 分析,在一类指标中,通过指标的不同特征,分析数据的情况。 然后根据需要统计分析的维度对数据进行柱状图和/折线图展 示。
进一步的,步骤S2中对数据进行标准化专业编码处理的步 骤如下:首先赋予标准化专业结构名称一个编码,然后把数据 跟标准化专业结构名称进行比较识别,并给予相似度匹配的数 据相同的编码。例如:“车站”专业给予“0301”编码,实际 数据表现会存在多样化(车站1,车站2,xx车站,车站(xx)) 它们同属于“车站”-0301这个标准归类,标准化需要把数据 跟标准化专业结构名称进行比较识别它为车站并给予编码。
其中,采用余弦相似度算法计算数据跟标准化专业结构名 称的文本相似度。
所述余弦相似度算法通过计算数据跟标准化专业结构名称 的两个向量的夹角余弦值来评估他们的相似度,其算法如下:
向量a=(x1,y1),
向量b=(x2,y2),
similarity=a.b/|a|*|b|a.b=x1x2+y1y2;
其中:向量a为数据,向量b为标准化专业结构名称,
得出的similarity值越大说明越相似,取相似度最大的给 予对应的编码。
余弦相似度算法是一个向量空间中两个向量夹角间的余弦 值作为衡量两个个体之间差异的大小,余弦值接近1,夹角趋于 0,表明两个向量越相似,余弦值接近于0,夹角趋于90度,表 明两个向量越不相似。下面举例使用余弦相似度计算两段文本 的相似度。思路:1、分词;2、列出所有词;3、分词编码;4、 词频向量化;5、套用余弦函数计量两个句子的相似度。
句子A:这只皮靴号码大了。那只号码合适。
句子B:这只皮靴号码不小,那只更合适。
1、分词:
使用结巴分词对上面两个句子分词后,分别得到两个列表:
listA=[‘这‘,‘只‘,‘皮靴‘,‘号码‘,‘大‘, ‘了‘,‘那‘,‘只‘,‘号码‘,‘合适‘]
listB=[‘这‘,‘只‘,‘皮靴‘,‘号码‘,‘不小‘, ‘那‘,‘只‘,‘更合‘,‘合适‘]
2、列出所有词,将listA和listB放在一个set中,得到:
set={'不小','了','合适','那','只','皮靴','更 合','号码','这','大'}
将上述set转换为dict,key为set中的词,value为set 中词出现的位置,即‘这’:1这样的形式。
dict1={'不小':0,'了':1,'合适':2,'那':3,'只 ':4,'皮靴':5,'更合':6,'号码':7,'这':8,'大':9}, 可以看出“不小”这个词在set中排第1,下标为0。
3、将listA和listB进行编码,将每个字转换为出现在set 中的位置,转换后为:
listAcode=[8,4,5,7,9,1,3,4,7,2]
listBcode=[8,4,5,7,0,3,4,6,2]
通过来分析listAcode,结合dict1,可以看到8对应的字 是“这”,4对应的字是“只”,9对应的字是“大”,就是句 子A和句子B转换为用数字来表示。
4、对listAcode和listBcode进行oneHot编码,就是计 算每个分词出现的次数。oneHot编号后得到的结果如下:
listAcodeOneHot=[0,1,1,1,2,1,0,2,1,1]
listBcodeOneHot=[1,0,1,1,2,1,1,1,1,0]。
进一步的,步骤S2中对数据进行特征提取关联的步骤如下: 在特征关联上,根据线路维度的特征继承到专业维度,建立特 征体系,一方面可以保证特征的值的继承,一方面可以保持特 征值的唯一性。例如a线路的特征:编组方式:4A那么同样该 线路下对应的专业,例如轨道专业--其编组方式数据来源继承 其父级,线路维度。同样为4A。在特征提取上,在特征体系中 建立部分特征提取的规则,并运用正则匹配或查找的方法来获 取线路维度的部分特征值;例如:线路特征:是否包含保安室, 那么我们需要查找改线路内容是否存在保安室,予以其特征值 是或否。又例如:我们要获取线路长度,则需用正则表达式匹配文本内容为“线路长度xx”正线公里的数据,以获取起线路 长度:xx正线公里。
以下,结合具体数据案例作出相应说明:
例如xx线路真实数据形式如下表1示:
表1
可见其工程及费用名称:
轨道工程
3.1正线轨道
(一)地下线
1、铺轨
(1)一般地段轨道铺轨
(2)GJ-III型减振轨道铺轨
(3)中档钢弹簧减振地段轨道铺设
。。。。。。
历史数据文件以excel形式存在。
第一步,读取文件数据,将非结构化数据转为结构化数据。
第二步,对数据进行标准化专业编码处理及特征提取关联;即 对读取数据进行标准化编码处理及特征提取关联,结果如表2 所示:
表2
轨道工程—轨道
3.1正线轨道—正线轨道新建—编码
(一)地下线—正线地下轨道
1、铺轨
(1)一般地段轨道铺轨—一般段铺轨
(2)GJ-III型减振轨道铺轨—高等段铺轨
(3)中档钢弹簧减振地段轨道铺设
。。。。。。
轨道特征:
钢轨类型:60/kg/m,轨枕类型:长轨枕,道岔类型:单开道 岔,特种道岔,线路长度:9.55/正线公里,车站数量:4/座, 区间数量:4/段,平均站间距:2.38/km,编制年限:2018-09-01, 车辆编组:6B,是否全地下敷设:是,敷设方式:地下敷设, 规划期:三期,初期配车数量:528/辆,停车场占地面积:176700/ ㎡,线路设计客流量:16.6/万人次/日,盾构内径:5.8/m。
第三步,计算线路工程造价数据指标,统计归集不同的费用类 型;指标如表3和表4所示:
表3
表4
第四步,如图2和图3所示,根据需要统计分析的维度对数据 进行图形展示。
以上所述者,仅为本发明的较佳实施例而已,当不能以此 限定本发明实施的范围,即大凡依本发明申请专利范围及发明 说明内容所作的简单等效变化与修饰,皆仍属本发明专利涵盖 的范围内。
机译: 高速公路铁路二工理轨道铺设机,用于城市轨道交通工程
机译: 城市轨道交通工程新型轨道层及其施工方法
机译: 一种在区域和系统之间进行交通工程计算的方法,一种设备及其存储介质