首页> 中文期刊> 《计算机应用与软件》 >基于密度聚类的签到轨迹大数据分层预处理研究

基于密度聚类的签到轨迹大数据分层预处理研究

     

摘要

随着基于位置的社交网络的发展,时空-文本等轨迹数据量呈指数式增长,与此同时数据低质的问题日益显著.高质的签到数据可以使研究人员更好地从中挖掘丰富且有意义的知识,因此为了更有效地使用签到大数据,数据预处理必不可少.签到数据具有冗余度高、同时签到、时空签到跨度大等低质问题,导致不能直接使用现有的数据预处理流程和方法.针对签到数据特性,提出一套具有针对性的数据预处理流程.通过平均化处理消除了签到轨迹中存在的同时签到数据;通过学习基于熵的时间戳间隔阈值划分签到轨迹,解决签到轨迹时间跨度大的问题;利用基于密度聚类的方法实现签到轨迹分层,解决空间跨度大的问题.实验采用真实的签到轨迹数据,从离群点和分层效果两个方法对预处理效果进行评价,实现不同空间粒度的签到轨迹分离预处理,为后续的轨迹分析与挖掘奠定基础.

著录项

  • 来源
    《计算机应用与软件》 |2019年第3期|20-28,56|共10页
  • 作者单位

    石家庄铁道大学 河北石家庄050043;

    河北省高校人文社会科学重点研究基地(石家庄铁道大学) 河北石家庄050043;

    石家庄铁道大学 河北石家庄050043;

    河北省高校人文社会科学重点研究基地(石家庄铁道大学) 河北石家庄050043;

    石家庄铁道大学 河北石家庄050043;

    河北省高校人文社会科学重点研究基地(石家庄铁道大学) 河北石家庄050043;

    石家庄铁道大学 河北石家庄050043;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 程序设计、软件工程;
  • 关键词

    签到轨迹; 预处理; 轨迹相似性; 聚类; 分层;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号