首页> 中文学位 >基于网络访问项序的移动用户重入网识别方法
【6h】

基于网络访问项序的移动用户重入网识别方法

代理获取

目录

声明

摘要

1 绪论

1.1 课题背景及研究意义

1.2 国内外研究现状

1.2.1 基于用户资料的识别

1.2.2 基于IMEI码的识别技术

1.2.3 基于数据源的用户特征挖掘识别技术

1.3 论文主要工作

1.4 论文组织结构

2 基于网络访问的重入网识别问题定义及解决思路

2.1 问题模型定义

2.2 解决思路

2.2.1 上网日志数据源的分析

2.2.2 基于数据挖掘启发式规则

2.2.3 基于启发式规则设计算法

2.3 本章小结

3 基于用户网络访问项序的重入网用户身份识别算法

3.1 数据预处理

3.1.1 数据清理

3.1.2 数据整理

3.2 相似用户集挑选

3.3 基于个性化网站的相似用户集裁剪

3.4 基于时间特征的相似用户集裁剪

3.4.1 基于用户整体上网时间的相似度比较

3.4.2 基于用户针对具体网站的访问时间相似度比较

3.5 基于网站访问项序的相似用户集裁剪

3.5.1 利用PrefixSpan算法挖掘用户的习惯性网站访问序列

3.5.2 利用LD算法计算习惯性网站访问序列相似度

3.5.3 基于相似度进行裁剪

3.6 基于网站访问频次的相似用户集裁剪

3.7 相同身份用户的识别

3.8 本章小结

4 实验例证和结果分析

4.1 实验环境

4.2 实验思路

4.2.1 数据集划分

4.2.2 各阶段阈值的确定

4.3 实验结果

4.4 本章小结

结论

参考文献

攻读硕士学位期间发表学术论文情况

致谢

展开▼

摘要

在任何的移动商务营销活动中,对于用户身份的唯一性标识都是不可或缺的基础工作。因为各种交叉因素的诸多影响,部分移动用户频繁的出入移动运营商网络已经成为普遍现象。伴随着用户的重新入网,那么针对该用户的旧号码的行为特征记录分析将完全失效,同时又需要重新对新号码的用户行为特征记录进行分析刻画,这样势必将耗费很长的时间才能重新获得该用户的完整行为刻画,对于运营商来说会造成极大的资源浪费和重复工作的不必要。所以对于重入网用户的身份识别有着很重要的意义和价值。
  目前对于移动用户重入网身份识别的研究主要是基于用户资料,IMEI码,呼叫指纹等进行识别。但是基于前两者的识别由于资料缺失、移动设备更换频繁等原因导致识别准确率较为低下,而基于呼叫指纹的识别方法的局限性较强,导致这些方法在实际生产操作中的可行性不大。在本文中,对于移动用户的重入网身份识别问题,从用户的上网行为特征出发,提出基于用户网络访问项序的用户相似性计算方法,根据“数据预处理→相似用户集挑选→基于个性化网站的相似用户集裁剪→基于时间特征的相似用户集裁剪→基于网站访问项序的相似用户集裁剪→基于网站访问频次的相似用户集裁剪→相同身份用户的识别”7个步骤对重入网用户身份进行精确的识别定位。
  最后,基于某通信运营商提供的某地区25809个用户60天网络访问日志数据集上,对本文所提方法的可行性与有效性进行了实验验证,结果显示总体准确率为96.64%,在可行性和有效性方面均有着很好的表现。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号