多维数据异常点识别方法的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

统计数据质量问题一直困扰着我国统计界,是政府和社会各界关心的问题我们需要一种能检查和审核统计数据的可靠性和准确性、识别异常数据的定量方法和工具。
　　在数据处理的过程中偶尔会出现一些异常的，不合逻辑的统计结果，这种结果的出现很可能是由于所处理的数据中包含异常数据造成的。但目前测量学中所提供的异常数据识别方法，都只针对一维数据，即只针对单一测量指标进行数据检查。然而，在统计实践中我们经常会感到仅仅使用单指标进行数据检查不能有效发现测量数据包含的全部异常。
　　为了探索解决此类问题的方法，提高统计数据的准确性和可靠性，本文通过文献资料法、比较分析法和探究性实验法，在对常用异常数据识别方法进行分析的基础之上，尝试寻找一种可应用于多指标情形下的异常数据的识别方法，为数据分析提供便利的辅助工具。
　　要建立异常点的识别方法，首先应寻找一个可以表达多指标情形下点与点之间关系的、简单易用的数量指标。距离是可以满足这个要求的指标之一，利用距离可以表示点与点间关系。如果某点是样本中的异常点，它必远离样本中的其它点，即与多数点的距离较大，其平均距离也必大。反之，若某点为正常值，则它必与样本中的某些点相邻较近，距离较小，则其平均距离必不大。基于此种思想，本文尝试利用点与点之间的平均距离作为识别多维指标下样本异常值的方法。并分别采用欧氏距离、马氏距离和斜交空间距离进行尝试。
　　利用距离建立多指标情形下的异常点识别方法，虽然只是一种尝试，在简单直观的二维数据的运用效果比较好些，但在多维空间中应用是否有较好的表现，由于缺少直观有效的判据而无法验证，值得深入研究、继续完善。对于本例，三种距离获得的结果差别不大，但从距离定义的差别分析，马氏距离应更优于欧氏距离和斜交空间距离。该方法目前尚未完善，还存在许多问题需要在今后的研究中不断完善。

著录项

作者
高玉霞;
展开▼
作者单位

沈阳体育学院;

展开▼
授予单位沈阳体育学院;
学科体育人文社会学
授予学位硕士
导师姓名郑凯;
年度 2010
页码
总页数
原文格式 PDF
正文语种中文
中图分类统计调查;
关键词
识别方法; 异常点; 多维数据; 统计数据质量;

相似文献

中文文献
外文文献
专利

1. 一种基于约束的多维数据异常点挖掘方法 [J] . 李翠平 ,李盛恩 ,王珊 . 软件学报 . 2003,第009期
2. 非正态变异下的非线性轮廓异常点识别方法研究 [J] . 聂斌 ,王曦 ,胡雪 . 运筹与管理 . 2019,第001期
3. 基于ISOMAP降维的复杂轮廓异常点识别方法 [J] . 聂斌 ,李京亚 ,姚雪海 . 中国机械工程 . 2016,第012期
4. 模糊数据中异常点的一种识别方法 [J] . 张爱武 . 工程数学学报 . 2012,第004期
5. 多维数据关联的机器人运动步态识别方法 [J] . 陈先睿 . 机械设计与制造 . 2021,第009期
6. 一种基于约束的多维数据异常点挖掘方法 [C] . 李翠平 ,李盛恩 ,王珊 . 中国科学院计算技术研究所第七届计算机科学与技术研究生学术讨论会 . 2002
7. 基于SVR的非线性轮廓数据异常点识别方法研究 [A] . 胡雪 . 2018

多维数据异常点识别方法的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅