您现在的位置: 首页> 研究主题> 异常值

异常值

异常值的相关文献在1976年到2022年内共计784篇,主要集中在自动化技术、计算机技术、水利工程、测绘学 等领域,其中期刊论文508篇、会议论文23篇、专利文献35530篇;相关期刊375种,包括统计与信息论坛、统计研究、电子科技大学学报等; 相关会议21种,包括中国计量协会冶金分会冶炼传感器专业委员会2013年年会及技术交流会、统计教育与应用统计研讨会、中国计量协会冶金分会2012年会暨全国第十七届自动化应用技术学术交流会等;异常值的相关文献由1976位作者贡献,包括方海泉、王斌会、赵超等。

异常值—发文量

期刊论文>

论文:508 占比:1.41%

会议论文>

论文:23 占比:0.06%

专利文献>

论文:35530 占比:98.53%

总计:36061篇

异常值—发文趋势图

异常值

-研究学者

  • 方海泉
  • 王斌会
  • 赵超
  • 王海宁
  • 石磊
  • 薛惠锋
  • 张博
  • 秦榕
  • 贾沛璋
  • 陶家祥
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 雍龙泉; 贾伟
    • 摘要: 对给定的数据,文章分别建立了以残差的平方和及绝对值和为目标的线性最小二乘与最小一乘模型,采用正弦余弦算法计算模型参数;然后应用于无异常值的模型和包含异常值的模型,计算结果发现异常值对最小二乘有着较大的影响,而对最小一乘的影响较小;表明最小一乘具有较好的稳健性。
    • 文海; 王涛; 王柯; 张健
    • 摘要: 靶场实测数据具有数据样本少、获取代价高等特点,从中剔除异常值,在军事、经济及时间上有重要意义。为降低数据录取给试验鉴定结论带来的误判风险,提出不确定度法,具体由预先评定出的测量结果不确定度和在实际测量过程中获得的最佳估计值来共同确定剔除异常值的实测数据录取方法,结合某型坦克炮身管内径鉴定试验,说明了不确定度法的内容及步骤。通过人为设定样本集并附加异常值进行MATLAB仿真分析,结果表明无论是样本量少,还是样本量多,运用不确定度法剔除异常值具有较高的可靠性。不确定度法充分考虑测量系统及测量过程的实际情况,运用计量结果等现有信息一次性评定出测量不确定度,即可在实际测量中进行重复应用,有利于靶场试验从策划到实施的质量控制。同时,在靶场采用不确定度法录取实测数据,具有简单快捷的特点,不仅满足一线的快速使用,而且还能显化出靶场计量在试验一线的贡献度。
    • 王志坚; 罗舒琪; 王斌会
    • 摘要: Cook距离公式常用于回归模型的异常值诊断,但由于公式中的样本方差■对异常值敏感,导致公式缺乏稳健性,使得诊断效果不理想。基于以上问题,文章选取绝对离差中位数作为样本标准差的稳健估计量,得到了样本方差■的稳健估计量,进而构造出稳健Cook距离公式;借鉴传统Cook距离的回归模型异常值诊断理论,将稳健Cook距离公式应用于时间序列异常值诊断,拓展了传统Cook距离公式的异常值诊断领域。通过选取模拟样本量分别为50、100、200,污染率分别为0、1%、5%、10%的ARMA(1,1)序列及金融时间序列进行实例分析,结果发现:(1)在无污染时,稳健Cook距离法与常规Cook距离法的诊断正确率均为100%,两者没有出现"误诊"现象;(2)在样本量、污染率同时增大时,常规Cook距离诊断正确率急剧下降,当污染率达到5%及以上时,已基本无诊断力,而稳健Cook距离法依然能保持较高的诊断力。稳健Cook距离法不仅能应用于时间序列异常值诊断,也能应用于回归分析的异常值诊断。
    • 宋丽娜; 刘淼; 秦韬; 何鑫; 郭中磊; 王小胜
    • 摘要: 为有效识别城镇取用水监测数据异常值,提高数据的可靠性与真实性,结合局部异常因子(LOF)算法与互补集成经验模态分解(CEEMD)法,开发城镇取用水监测数据异常值自动识别的方法。先应用LOF进行可直观异常值识别,再应用CEEMD对修正后的数据序列进行频谱分解,通过低频叠加分量拟合序列并设定相对误差阈值用以识别不可直观异常值,以河北省某自来水厂日取用水监测数据进行实验分析,结果显示,修正后的年取用水数据由直接监测的51.27万m^(3)减少为41.14万m^(3),修正结果与人工核定的年取用水量更为接近。研究结果表明:直接使用监测数据用以统计年取用水量存在较大误差,提出的方法可有效识别取用水量监测数据中的异常值并进行修正,为后续的水资源强监管提供技术支撑。
    • 刘志娜
    • 摘要: 在定量包装商品净含量检验过程中,偏差较大的数据时常出现,分析处理这些异常值,有利于正确判断检验结果。本研究通过定量包装商品净含量检测工作,得到相应检测数据,利用格拉布斯准则判别得出的数据2.331为异常值并对该异常值进行有效剔除;然后利用一个新的检验数据重新进行计算,修正后的平均实际含量可以更客观的表现样本情况。同时,对于异常值产生的原因和可能造成的后果进行分析,并制定行之有效的处理措施。
    • 颜海波; 邓罡; 姜云卢
    • 摘要: 含异常值的数据和高维数据越来越频繁地出现,对现有的稳健估计和多元线性回归估计方法提出了挑战。传统的多元线性回归模型估计对异常值非常敏感,基于MCD估计方法的多元线性回归估计对异常值有一定的抵御作用。但随着数据维数的增加,MCD估计的精度不断降低,稳健性也随之降低,且当数据维数大于样本量时MCD估计方法失效。因此,本文利用MRCD的均值向量和协方差矩阵估计,提出了基于MRCD估计方法的高维稳健多元线性回归模型估计。数值模拟的结果表明,基于MRCD估计方法的多元线性回归模型估计能很好地抵御异常值,且在数据维数大于样本量的情况下,基于MRCD估计方法的多元线性回归估计更为有效。实证分析的结果表明,基于MRCD方法的多元线性回归估计能更好地抵御异常值并得到更好的预测效果。
    • 黄成明; 胡坚
    • 摘要: 随着“互联网+”的不断发展,农产品电商发展迅速。但当前农产品冷链物流面临调度效率低下问题,这不但对企业效益造成损失,还会引发农产品健康安全问题,如何提升农产品冷链物流智能化程度,是全社会亟需解决的问题。针对上述问题,本文提出了一种基于改进GBDT(Gradient Boosting Decision Tree,梯度提升决策树)算法的农产品冷链物流资源需求预测模型,创新性的提出了一种新的-Huber损失函数,能在提高收敛速度的同时,降低对异常值的惩罚,从而提高预测精度。
    • 雷发美; 万艳; 商少平; 陈剑桥
    • 摘要: 随着国家对海洋的重视,我国的海洋开发和管理日益加强,极大地推动了海洋观测系统的发展,也促进了海洋观测仪器的技术革新及海洋观测数据种类和数据量的快速增长,然而对多源观测数据实行准确有效的数据质量评估成为社会各界共同关注的议题。本文对海洋浮标表层环境要素数据提出了一种简洁实用的质控流程和方法,包括前处理质控、数理统计质控、局地质控、误差控制、人工审核及数据质量标识等步骤,并对福建省海洋观测网的7个大型海洋浮标观测数据进行质控,结果表明:一般情况下不需人工干预就可以有效地检出表层环境要素的异常数据。实践表明,该质控流程和方法也可以适用于其他同类海洋观测平台获取的延时或实时资料,为最终获得完整、准确、质量可靠的海洋观测数据提供有力支撑。
    • 吴薇薇; 陈新元; 张皓瑜; 季灵; 刘硕
    • 摘要: 利用时间序列分析中干预分析模型研究了我国民航客运量在极端事件时受到的干预影响.结果表明我国民航客运受到多次连续冲击,在2020年2月受到一次较大的负冲击,同样在3月也受到一次负冲击,但由于我国国内民航市场潜力大,国内控制较稳定,及政府相关政策的有效扶持,民航客运在8月份受到正冲击,下半年客运量有所恢复.全年总冲击为负值,表明此次极端事件对我国民航客运造成较大负面效应.2月份受到的冲击效应持续到年底且逐渐减弱,表明极端事件对我国民航客运造成长久且持续的影响,国内客运量仍具有进一步增长空间.
    • 刘晓杰
    • 摘要: 针对GPS数据时间跳变问题引起的行程时间、行程速度以及车辆运行状态变化识别等指标的计算错误,提出基于轨迹连线的时间跳变点修正方法。修正过程主要包括依据时间变量对GPS数据排序、跳变点识别并编号、跳变点修正以及修正效果评价。以西安市出租车GPS数据为例,进行验证。研究结果表明,经过该方法修正后,数据中跳变错误点的比例从原始的6.5%降至0.5%,车辆轨迹连线偏离度由7.0%降至1.3%,该方法修正效果好,有效提高了指标计算的准确性以及基于该指标研究的准确性,具有一定的借鉴意义。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号