首页> 中文会议>第33届中国数据库学术会议(NDBC2016 ) >一种高效的降低语义轨迹基础频繁模式稀疏度的方法

一种高效的降低语义轨迹基础频繁模式稀疏度的方法

摘要

随着GPS定位技术的不断发展与智能移动设备的普及,轨迹数据的获取变的越来越容易,同时轨迹数据相关的应用需求也逐渐增多.在普通轨迹数据上加入一定的语义信息,即可使得普通轨迹数据变为语义轨迹数据,通常语义轨迹包含有地理位置、时间与语义三方面的信息.从语义轨迹中挖掘频繁模式是轨迹数据研究中的重要问题,是很多语义轨迹相关应用的基础,如相似性计算、目的地预测、线路推荐等的基础.然而目前的语义轨迹频繁模式挖掘算法仅考虑地理位置和语义信息,并没考虑能够反映用户行为的时间信息(包括到达时间、离开时间、停留时间、行驶时间等).在考虑时间信息后,语义轨迹频繁模式的挖掘将会面临数据稀疏性问题,即很多频繁模式的概率值过小或为零,从而无法挖掘出有意义的频繁模式.因此,本文首先采用基于信息熵的聚类方法对语义轨迹的基础频繁模式进行划分以降低数据稀疏度,然后提供了基础频繁模式集更新的增量方法及剪枝方法以提高其维护效率,最后在真实数据上进行实验并验证了本文算法的有效性及高效性.本方法提供了一种将用户到达时间信息有效、高效的加入到语义轨迹频繁模式途径,它可以作为现有基于频繁模式的语义轨迹相关应用算法的输入,从而使得这些算法可以挖掘出更有意义的频繁模式进而更好的挖掘用户行为.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号