首页> 中文学位 >基于深度对抗强化学习的电商广告竞价排序问题研究
【6h】

基于深度对抗强化学习的电商广告竞价排序问题研究

代理获取

目录

声明

摘要

1.1研究背景和意义

1.2研究内容和贡献

1.3论文组织结构

第2章相关理论与技术研究

2.1强化学习原理及技术介绍

2.1.1马尔可夫决策过程

2.1.2强化学习交互过程

2.1.3行动器-评价器方法

2.2生成对抗理论及发展

2.2.1生成对抗网络

2.2.2生成对抗网络的发展

2.2.3对抗强化学习

2.3强化学习在电商场景的应用

2.4生成对抗理论在电商场景的应用

2.5本章小结

第3章广告竞价排序问题描述

3.1电商广告业务介绍

3.1.1广告平台操作流程

3.1.2广告业务常用词

3.1.3广义第二价格

3.2广告竞价排序问题的决策视角

3.3广告竞价排序模型

3.3.1广告竞价排序模型架构

3.3.2广告竞价排序模型视角

3.4广告主决策模型

3.4.1广告主与广告平台

3.4.2决策模型及策略仿真

3.5本章小结

第4章基于深度对抗强化学习的广告排序决策模型

4.1问题建模

4.2广告主决策的行动器-评价器模型

4.2.1广告主决策模型架构

4.2.2基于LSTM的广告动态特征转移

4.2.3基于PPO的广告主决策模型

4.2.4基于GAE的优化的广告主决策模型

4.2.5模型优化技巧

4.3基于对抗强化学习的广告竞价排序仿真平台

4.3.1仿真平台模型

4.3.2预训练模型

4.3.3仿真平台算法

4.3.4激活函数的选择

4.4本章小结

第5章仿真平台实验验证

5.1数据集选择与问题分析

5.2数据预处理与特征提取

5.2.1数据预处理

5.2.2数据集分割及特征提取

5.3实验环境及参数的设置

5.3.2模型参数设置

5.4实验的设计与结果评价

5.4.1预训练结果分析

5.4.2状态转移模型训练结果分析

5.4.3Virtual-ADer训练结果分析

5.5本章小结

6.1论文工作总结

6.2未来工作展望

参考文献

致谢

攻读学位期间发表的学术论文

展开▼

著录项

  • 作者

    殷小静;

  • 作者单位

    山东大学;

  • 授予单位 山东大学;
  • 学科 软件工程
  • 授予学位 硕士
  • 导师姓名 崔立真;
  • 年度 2021
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号