法律状态公告日
法律状态信息
法律状态
2017-04-05
授权
授权
2015-08-12
实质审查的生效 IPC(主分类):G01C5/00 申请日:20150403
实质审查的生效
2015-07-15
公开
公开
技术领域
本发明涉及一种GPS高程异常数据的粗差探测方法,属于“测绘科学与技术” 学科中的“大地测量学”技术领域。
背景技术
数据是进行科学研究的基础,为此人们运用各种手段获得测量或实验数据。 由于种种原因,测量数据与被测原型的真值不完全一致,其中包括粗差、系统误 差和偶然误差等测量误差。在应用测量数据时,要求数据仅含有偶然误差。系统 误差可以采用一定的方法发现和修正。所谓检测粗差就是检测数据是否含有粗 差,以及定位哪一个数据是粗差。如果不能有效地对粗差进行检验、识别,将会 对参数的估计结果产生严重影响。检测粗差是有效的应用测量数据的前提。
对于粗差检测,先后进行了一维和多维的粗差检测研究。目前有以服从正态 分布的标准残差为统计量的数据检测法;粗差判断的Bayes法;基于岭估计的 粗差检测方法;粗差的拟准检定法;基于方差膨胀模型的多个粗差的检测法;应 用偏相关系数区分多维粗差和用复相关系数对多维粗差进行总体显著性检测并 定位等。综合来看,多维粗差检测和定位比较困难,主要是难以确定粗差的维数。 如果用试探法同时确定多个粗差,试探的组合数可能相当大,也难以实现;一维 粗差检测法虽简单可行,但未能考虑粗差对残差影响的相关性,用它逐次判断多 个粗差的存在,也可能判断失误。
针对以上问题,本发明提出利用“奇异点”集,采用一定的工作流程来准确 进行多维粗差检测及定位的方法。本发明的实质是将不同方法得到的强影响点的 并集作为“奇异点”集,可以大大提高检测测量数据粗差的准确性。本发明对提 升测量数据的应用质量具有重要意义。
发明内容
发明目的:本发明的目的在于本发明的目的是提供一种检测多维粗差的方法,使 用该方法,能准确检测出测量数据中的粗差,使用方便。
技术方案:本发明所述的检测多维粗差的方法为:
1)利用观测值建立如下模型:
函数模型:L=AX+Δ (1)
随机模型:E(Δ)=0,
式中:为观测值向量;为未知参数向量;为未知参数的系数矩阵,rank(A) =p;为随机误差向量;E(·)为数学期望;D(·)为方差—协方差矩阵;为 单位权方差;QLL为观测值协因数阵;P为权阵。
a)参数估计
X的估值用表示,并令N=ATPA。当rank(A)=p为列满秩阵时,得未知 参数X最小二乘估计
误差向量的最小二乘估计
H=A(ATPA)-1ATP (5)
称为帽子矩阵。
残差的协因数矩阵
QVV=(I-H)QLL (6)
b)单位权方差的估值
2)计算Cook距离,根据各观测值的Cook距离D(i)和平均值D平均之差,确 定强影响点号
式中:为从完全数据回归未知X的最小二乘估计;为删掉第i组数据后; 从剩余的n-1组数据回归X的最小二乘估计。
当D(i)-D平均>0时确定第i号点为强影响点。
3)计算wk距离并依据分位值确定强影响点号
用式(9)计算Welsch—Kuh距离
当
时,第i个点为强影响点。
时,第i个点为强影响点。式中vi为(4)式中的第i(i=1,2,…n) 个观测值的改正数,为去掉第i个观测值的σ0的估值,为(6)式中第i个主对角 元,hii为(5)式中的第i个主对角元。为服从自由度为(n-t-1)的t分布值。
4)将Cook距离及Welsch—Kuh距离确定的强影响点号组成并集,得异常点 集。令不重复的强影响点号个数m为粗差的维数;
5)令
Qee=(BTPQVVPB)-1 (10)
则
Xe=-QeeBTPV (11)
式中B=(E1,E2,…,Em)为n×m矩阵,Ei为n×1向量,其中第i行元素 为1,其余元素为零。
6)做粗差的定位。
令
当Fi>Fα,即第i(i=1,2,…n)号点为粗差点,粗差点个数为n1(n1=0或n1 ≤m);Fα为服从自由度为(1,n-t-m)的F分布值。
8)若第6)步中n1≠0,剔除n1个粗差数据,得n2=n-n1组观测数据,循环步 骤1)—6)直至没有粗差点。若第6)步中n1=0,结束。
本发明与现有技术相比,其有益效果是:1)粗差定位准确高效。经过大量 实例应用结果分析,在粗差维数达到总样本的19%时,本发明仍能将粗差准确 的定位。
2)使用方便。整个多维粗差定位过程,无需编制专门的程序,仅需利用国 际公认的标准计算软件MATLAB,以及t分布和F分布表即可完成粗差定位,快 速、方便。
具体实施方式
下面对本发明技术方案进行详细说明,但是本发明的保护范围不局限于所述 实施例。
实施例1:
在描述具体实施过程时,结合某具体工程实例,对本发明方法作详细说明。
(1)工程实例背景介绍
建立区域似大地水准面,需布设测量控制点。为获取有关数据,要求对测量 控制点进行两项测量工作,GPS测量和水准测量。
①GPS测量:按照国家测量规范要求,对所有控制点进行相应等级的GPS测 量,目的是获取各控制点的高斯平面坐标和大地高。
②水准测量:按照国家测量规范要求,对所有控制点进行相应等级的水准测 量,目的是获取各控制点的正常高高程,并计算各控制点的高程异常。
具体实施例,建立区域面积约为220km2的似大地水准面,共布设36个测量 控制点。按照国家测量规范要求,对所有控制点进行了C级GPS测量和三等水 准测量,获得不含粗差的GPS高程异常数据如表1所示:
表1 GPS高程异常数据表
现对5、10、15、20、25、30及35分别施加3.5~10倍中误差的粗差。得 含有粗差的数据如表2:
表2含有粗差的GPS高程异常数据表
(加*者为粗差点)
(2)利用观测值建立模型
建立二次曲面模型
ξ=b0+b1x+b2y+b3x2+b4xy+b52 (15)
式中,ξ为GPS点的高程异常;bi为二次曲面模型的待定参数(共6个);x、 y为GPS点的高斯平面坐标。
具体实施例,将表2的36组GPS高程异常数据逐个代入(15)式,可以得 到形如(1)的式矩阵形式。然后根据式(3)、(4)、(5)、(6)、(7)计算V、H、QVV及
(3)根据(8)式计算Cook距离见表3,且D平均=0.0319。经过计算1、4、 5、8、10、15、16、20、25、30及35号点的D(i)-D平均>0,故其为强影响 点。
(4)用式(9)计算Welsch—Kuh距离见表3,并依据分位值确定强影响点 号。由表3知25及35号点的Welsch—Kuh距离(加*号者)大于其分位置 (α=0.05),故25及35号点为强影响点。
表3 Cook距离及Welsch—Kuh距离(wk)表
(5)由步骤(3)及(4)的并集得异常点集为1、4、5、8、10、15、16、 20、25、30及35号点。m=11。
(6)根据式(10)—式(14)进行粗差定位。其中t=6,α=0.05及
定位结果见表4,7个粗差点全部定位正确。
表4粗差定位结果表
如上所述,尽管参照特定的优选实施例已经表示和表述了本发明,但其不得 解释为对本发明自身的限制。在不脱离所附权利要求定义的本发明的精神和范围 前提下,可对其在形式上和细节上作出各种变化。
机译: 异常数据生成装置,异常数据生成模型学习设备,异常数据生成方法,异常数据生成模型学习方法,以及程序
机译: 当有异常数据检测装置,异常数据检测方法和异常数据检测
机译: 异常数据检测程序异常数据检测装置及异常数据检测方法