首页> 中文学位 >跨设备识别用户及其行为研究
【6h】

跨设备识别用户及其行为研究

代理获取

目录

声明

第1章 绪论

1.1 研究背景与意义

1.2 研究现状

1.3 本文研究内容

1.4 论文组织结构

1.5 本章小结

第2章 相关理论及模型概述

2.1 相关理论概念介绍

2.2 相关模型--Boosted Tree模型

2.3 相关模型--FM模型

2.4 相关模型--FFM模型

2.5 本章小结

第3章 跨设备用户行为及其特征空间

3.1 研究数据

3.2 用户行为分析

3.3 数据特征空间

3.4 本章小结

第4章 基于XGBoost模型的跨设备用户识别

4.1 XGBoost模型

4.2 实验设计与结果分析

4.3 本章小结

第5章 基于优化提升的FFM模型用于跨设备预测分析

5.1 基于优化提升的FFM模型

5.2 实验设计与结果分析

5.3 本章小结

第6章 总结与展望

6.1 总结

6.2 展望

参考文献

致谢

攻读硕士期间的学术成果和参与的科研项目

展开▼

摘要

随着各种智能电子设备在人们生活中的广泛应用,比如智能手机,平板电脑,笔记本电脑等各种移动智能设备,人们越来越倾向于通过不同的智能设备来完成相同的任务。然而,当用户在不同智能设备之间来回切换完成任务的时候,他们的识别信息就会变得非常模糊,以至于难以追踪到他们的踪迹。广告商希望能够找到使用这些设备的用户而不是设备本身,这样便可以针对用户所要完成的任务来做一些精准营销。因此,近些年来跨设备识别用户逐渐成为了一个热门的研究主题,它对于提高广告营销的价值以及提升用户的体验具有重要的意义。
  近些年来,很多普通的家庭或者个人都拥有多个可以连接互联网的智能设备,随着物联网时代的来临,智能设备更会呈现爆发式的增长。广告公司总是希望无缝地连接到设备背后的消费者,而不是设备本身。传统的办法是利用一些确定性的特征,比如电话号码,身份证号,电子邮箱等,这些特征需要用户主动提供,类似于我们日常使用的登录帐号。当用户在不同智能设备之间来回切换时,根据确定性特征便可以唯一确定一个用户。然而,出于对隐私性和安全性的考虑,用户很可能会拒绝提供他们的私人信息,这就给跨设备识别用户带来了很大的困难和挑战。
  针对传统跨设备识别方法的不足,近些年来已有一些学者对传统方法尝试了不同的改进,大多数研究以分析用户行为的一致性为基础。随着机器学习的兴起,一些学者提出基于概率的机器学习方法来预测用户拥有某一智能设备的概率,很好的提升了跨设备识别的准确率。然而,跨设备用户的行为数据的规模通常是非常巨大的,而且非常稀疏,现有的一些研究通常都面临着数据规模以及时间消耗的问题。
  本文在跨设备识别用户的需求越来越强烈的背景下,通过分析以及处理了大量的用户跨设备行为数据,充分对比了现有的机器学习方法的优缺点,并讨论了时间消耗以及数据稀疏性的处理问题,提出了基于优化提升的FFM模型,解决了跨设备识别用户的问题。本文贡献如下:
  1)用户行为分析及其特征空间:对跨设备用户行为进行了详细的分析,并对数据进行了较完整的预处理,通过分析特征之间的关系生成了更加完整的特征。同时对数据的缺失值进行处理,进行了One-Hot编码,数据标准化等处理,使预测结果更好。
  2)不同算法之间的比较:充分比较了可用于解决跨设备识别用户问题的八种机器学习模型,比较了它们在不同数据集上的表现,同时讨论了不同模型的时间消耗问题,得到了XGBoost是较好的处理这个问题的模型的结论,并探究了XGBoost模型的最优参数选择问题。
  3)提出了基于优化提升的FFM模型:对于大规模数据的稀疏性问题,FFM模型能较好的进行处理,我们在它的基础上,根据跨设备用户行为的地域特征,提出了基于优化提升的FFM模型。模型不但能解决大规模数据的稀疏性问题,而且在十一种模型的对比实验结果上表明,我们的模型具有更好的实验结果以及更稳定的特性,同时我们探究了模型的参数选择最优化问题。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号