首页> 中文学位 >基于可扩展分解机器的搜索广告点击率预估
【6h】

基于可扩展分解机器的搜索广告点击率预估

代理获取

目录

声明

致谢

摘要

第1章 绪论

1.1 课题背景

1.2 点击模型研究现状

1.3 本文主要研究内容

1.4 论文的内容组织

第2章 搜索广告点击模型

2.1 基本假设

2.1.1 检查假设

2.1.2 顺序假设

2.2 基于贝叶斯网的方法

2.2.1 基本概率图模型

2.2.2 扩展模型

2.3 基于统计模型的方法

2.3.1 基于最大熵原理的统计模型

2.3.2 树类统计模型

2.4 评价指标

2.4.1 Log-likelihood

2.4.2 Click Perplexity

2.4.3 AUC

2.4.4 NDCG

2.5 点击模型的应用

2.6 本章小结

第3章 CTR预估中的特征

3.1 CTR预估问题定义

3.2 CTR特征设计原则

3.3 单特征

3.3.1 id类特征

3.3.2 属性类特征

3.4 组合特征

3.4.1 时间序列类特征

3.4.2 环境类特征

3.5 统计类特征

3.6 本章小结

第4章 基于可扩展分解机器的点击模型

4.1 张量分解

4.2 分解机器

4.2.1 一般形式和应用

4.2.2 分解机器的性能分析

4.2.3 分解机器的局限性

4.3 可扩展分解机器SFM

4.3.1 层次张量模型

4.3.2 路经编码正则项

4.3.3 在线工作集优化算法

4.3.4 性能分析

4.4 作为点击模型的SFM

4.5 本章小结

第5章 实验与分析

5.1 实验设计

5.1.1 数据集

5.1.2 参数设置

5.2 模型有效性

5.2.1 在线与批量优化

5.2.2 正则项

5.3 特征有效性

5.3.1 特征体系

5.3.2 组合特征

5.4 点击率预估

5.4.1 分解模型对比

5.4.2 排序能力

5.4.3 Click Perplexity

5.4.4 存储与时间性能

5.5 本章小结

第6章 总结和展望

6.1 全文总结

6.2 未来工作

参考文献

作者简历及在学期间所取得的科研成果

展开▼

摘要

搜索广告通过用户的检索行为触发广告的生成,是目前互联网流量变现的主要模式之一。搜索引擎一般按照广告的点击率(Click-Through-Rate,CTR)和广告的出价之积来筛选广告,其中CTR预估是核心问题之一,它对搜索引擎的收入和用户的体验都有重大影响,点击模型是预估CTR的主要方式。但是,由于搜索广告数据量大,特征维度高且长尾现象明显,目前大多数点击率预估系统无法高效的在如此大量的稀疏且高维的数据上准确预估CTR。因此设计恰当的特征体系,建立高效可扩展的点击模型,并且利用在线优化算法快速迭代成为急需解决的三个问题。本文的主要工作如下:
   1.提出点击率预估特征设计原则,基于此提出五组特征,包括从用户,广告,以及环境三个维度,由单特征到组合特征,统计特征等多粒度的特征集合;
   2.设计了用作点击模型的可扩展分解机器SFM,利用维度树结构将分解机器所基于的切片张量分解重构成层次切片分解。由于利用了层次结构,不仅模型的空间复杂度大大下降而且方便了在线算法的设计,此外,借助于分解模型,模型能在长尾数据上更准确的预估参数,利用proximal gradient方法,在线工作集优化算法能更快收敛。
   3.基于真实搜索广告日志数据进行了三组实验来模拟线上CTR的预估,结果表明,CTR特征体系能够有效提升模型对搜索广告点击率预估的准确度,SFM相比FM能够有效降低模型的存储空间,online策略的工作集算法比batch策略能更快的收敛到局部最优解,在点击率预估方面,SFM在高频和长尾搜索日志数据上的CTR预估准确度以及排序能力均于好于作为基线模型的分解机器,Logistic Regression模型和User Browsing模型。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号