公开/公告号CN112347087A
专利类型发明专利
公开/公告日2021-02-09
原文格式PDF
申请/专利号CN202011062646.4
申请日2020-09-30
分类号G06F16/215(20190101);G06F16/2458(20190101);G06F17/18(20060101);G06F30/20(20200101);
代理机构32252 南京钟山专利代理有限公司;
代理人王磊
地址 200071 上海市静安区天目东路80号
入库时间 2023-06-19 09:51:02
技术领域
本发明属于高铁沿线风速数据质量控制技术领域,具体涉及一种高铁沿线风速观测数据质量控制方法。
背景技术
随着高速铁路的快速发展和列车速度不断提高,对铁路安全及铁路沿线周围环境监测数据的要求也越来越高。铁路列车运行的安全很大程度上受沿线风速的影响,其中,恶劣强风是造成铁路行车事故的主要自然灾害之一。然而,一切高速铁路从决策到落实都是基于可靠的沿线测风数据,所以对铁路沿线测风数据资料的质量有一定的要求。
受客观条件影响,高铁沿线测风仪的观测数据在测量、记录以及编码传输环节中可能会产生数据误差、数据缺失、数据失真等问题,每一个环节都有产生错误的可能,因此最终传输到服务终端的测风数据也就缺乏相应的可靠性。为此,为保障高铁的安全运行、研究高铁沿线测风数据对正常铁路运行的影响,需要对测风数据进行严格的质量控制,这样才能够建立可靠的测风数据集。
风的质量控制旨在解决两个问题:一方面要保证实际获得数据的完整性,即保证在测风周期内具有完整的观测数据;一方面要检查出数据中存在的不合乎规律的观测数据并加以修正。在气象领域,对自动气象站风速观测数据的质量控制,通常应用一些初步的质量控制方法(如气候极值检查、时间一致性检查、空间一致性检查、持续性检查、要素间一致性检查等),这些方法能解决小部分问题,但是还存在以下几点问题:1)这些方法只能查找出与实际风速相差较大的错误数据并加以标记或剔除,不能够对查找出来的错误数据进行修正以给出可靠的值;2)这些方法不能够对原始数据资料中缺失的数据进行补全;3)这些方法的测试范围比较宽泛,只能查找出误差较大的数据,不能实现精细化检查。在实际工程中,规定了一段高铁线路只架设单个测风塔,没有可用填补数据的备用设备,如果直接将气象领域的风速质量控制方法应用到高铁测风资料中显然行不通。目前,行业内没有一种专门针对高铁沿线精准风速观测资料的质量控制方法以解决沿线风速资料的质量问题。
发明内容
本发明所要解决的技术问题是针对上述现有技术的不足,提供一种高铁沿线风速观测数据质量控制的方法。
为实现上述技术目的,本发明采取的技术方案为:
一种高铁沿线风速观测数据质量控制方法,包括如下步骤:
步骤1:采集高铁沿线测风数据,对采集到的数据经过基本的质量控制后,选取没有错误值的连续时间段数据,划分为风速建模序列x(t),t=1,2,L,n和测试序列y
步骤2:依据相空间重构理论,运用C-C法对建模风速序列x(t)进行相空间重构,重构后的相空间为{X
步骤3:根据重构后的相空间{X
步骤4:根据加权最小二乘法设定误差最小化目标函数minz,结合预测方程计算得到预测值
步骤5:将风速建模序列x(t)向后移动一个时间点,重复步骤二至四,不断迭代得到多个预测值组成的预测序列
步骤6:将预测序列y
为优化上述技术方案,采取的具体措施还包括:
进一步地,质量控制包括气候极值检查、时间一致性检查和持续性检查。
进一步地,依据相空间重构理论,运用C-C法确定建模风速序列x(t)的嵌入时间τ和嵌入维m,对长度为n的建模风速序列x(t)进行相空间重构,重构后的相空间为{X
进一步地,以预测中心相点X
计算前M-1个相点的熵值E
利用一阶局域线性拟合得到
其中:E为单位矩阵,a、b为预测方程的参数。
进一步地,根据加权最小二乘法设定误差最小化目标函数minz,对误差最小化目标函数求其偏导并令其为0,求得a和b的值带入预测方程,计算得到演化的中心相点预测组
其中:τ表示嵌入时间,j表示嵌入维数。
进一步地,将预测序列与测试序列分别进行均方根误差RMSE、平均绝对误差MAE、决定系数R
将预测序列y
当RMSE、MAE的值较小,同时R
利用检错公式进行判断,如果预测序列y
检错公式为:|y
其中:f是质量控制参数设置为3,δ是目标站风速建模序列与测试序列之间的标准误差。
当对人工误差的检错率较高时,根据存疑数据查找出原始数据中存疑和错误的数据。
本发明的有益效果:
本发明一种可用于高铁沿线的单塔质量控制方法,通过高铁沿线的单个测风塔测风序列,通过相空间重构,利用改进的相点获取及权值重设进行一阶加权预测,预测模型建搭速度快,算法时间复杂度小,精度高,能够有效的提高测风数据的准确性,同时能够快速有效地测试出原始资料中的错误数据,同时也可以为缺失数据进行插补。
附图说明
图1是本发明的流程图;
图2是c-c法结果统计图;
图3是四种方法预测与原始序列对比图;
图4是四种方法的MAE、RMSE和R
具体实施方式
以下结合附图对本发明的实施例作进一步详细描述,利用京沪高铁某段所设的一个测风塔观测数据进行实施例分析:
步骤1:将采集到的数据经过气候极值检查、时间一致性检查和持续性检查这三个初步的质量控制标记并剔除错误值,选取没有错误值的连续时间段数据,具体为该测风塔的2016年7月到2017年9月测风数据,对每天的风速求平均以组成长度为427的日均风速序列;
将长度为427的日风速序列进行划分,2016年7月—2017年7月日风速数据作为建模样本集x(t),t=1,2,L,n,其中n=366,t表示采样时间;2017年8月—2017年9月的61个日风速数据作为测试集,用y
步骤2:依据相空间重构理论,运用C-C法确定日风速序列的嵌入时间τ和嵌入维m,其中τ=2,m=4,见图2,对长度为n的风速建模序列x(t)进行相空间重构,重构后的相空间为{X
步骤3:根据重构后的相空间{X
具体为:以预测中心相点X
计算前M-1个相点的熵值E
其中:E为单位矩阵,a、b为预测方程的参数,E
利用一阶局域线性拟合得到
步骤4:根据加权最小二乘法设定误差最小化目标函数minz,结合预测方程计算得到预测值
具体为:为使预测达到最佳效果,根据加权最小二乘法设定误差最小化目标函数minz,对目标函数求其偏导并令其为0,求得a和b的值并带入步骤6的预测方程中,计算得到演化的中心相点预测值组
其中:
其中:τ表示嵌入时间,j表示嵌入维数。
步骤5:将风速建模序列x(t)向后移动一个时间点,重复步骤二至四,不断迭代得到多个预测值组成的预测序列
步骤6:将预测序列y
具体为:将预测序列与测试序列分别进行均方根误差RMSE、平均绝对误差MAE、决定系数R
将预测值y
其中:MAE=0.21,RMSE=0.28,R
当RMSE、MAE的值较小,同时R
利用检错公式进行判断,再根据检错公式,如果预测序列y
检错方法公式为:|y
如图3和4所示,将本方法采用的改进加权一阶局域预测法MWFLM与加权一阶局域预测方法WFLM、加权零阶预测方法WZLM、改进加权零阶预测方法MWZLM进行对比;预测序列与原始序列的误差见图3,预测精度从高到低排序为MWFLM>WFLM>MWZLM>WZLM。由此可见,本方法得到的评价指标MAE、RMSE和R
本实施例利用京沪高铁某路段测风塔日均风速数据,将序列经过相空间重构后构建改进的加权一阶预测模型,提出了一种改进的高铁单塔测风数据质量控制方法,该方法的模型搭建速度快,算法时间复杂度小,精度高,能够有效的提高高铁沿线测风数据的准确性。通过图3和图4的对比分析验证了本发明方法质量控制效果明显。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。
机译: 列车控制系统,用于提高铁路沿线危险源附近的安全性
机译: 列车控制系统,用于提高铁路沿线危险源附近的安全性
机译: 大结构复杂高铁矿床地下开发中的矿石质量控制方法