声明
摘要
1 绪论
1.1 课题背景及研究意义
1.2 国内外研究现状
1.2.1 基于用户资料的识别
1.2.2 基于IMEI码的识别技术
1.2.3 基于数据源的用户特征挖掘识别技术
1.3 论文主要工作
1.4 论文组织结构
2 基于网络访问的重入网识别问题定义及解决思路
2.1 问题模型定义
2.2 解决思路
2.2.1 上网日志数据源的分析
2.2.2 基于数据挖掘启发式规则
2.2.3 基于启发式规则设计算法
2.3 本章小结
3 基于用户网络访问项序的重入网用户身份识别算法
3.1 数据预处理
3.1.1 数据清理
3.1.2 数据整理
3.2 相似用户集挑选
3.3 基于个性化网站的相似用户集裁剪
3.4 基于时间特征的相似用户集裁剪
3.4.1 基于用户整体上网时间的相似度比较
3.4.2 基于用户针对具体网站的访问时间相似度比较
3.5 基于网站访问项序的相似用户集裁剪
3.5.1 利用PrefixSpan算法挖掘用户的习惯性网站访问序列
3.5.2 利用LD算法计算习惯性网站访问序列相似度
3.5.3 基于相似度进行裁剪
3.6 基于网站访问频次的相似用户集裁剪
3.7 相同身份用户的识别
3.8 本章小结
4 实验例证和结果分析
4.1 实验环境
4.2 实验思路
4.2.1 数据集划分
4.2.2 各阶段阈值的确定
4.3 实验结果
4.4 本章小结
结论
参考文献
攻读硕士学位期间发表学术论文情况
致谢