首页> 中文学位 >基于深度对抗强化学习的电商广告竞价排序问题研究

【6h】

基于深度对抗强化学习的电商广告竞价排序问题研究

代理获取

页面导航

目录
著录项
相似文献
相关主题

目录

声明

摘要

1．1研究背景和意义

1．2研究内容和贡献

1．3论文组织结构

第2章相关理论与技术研究

2．1强化学习原理及技术介绍

2．1．1马尔可夫决策过程

2．1．2强化学习交互过程

2．1．3行动器-评价器方法

2．2生成对抗理论及发展

2．2．1生成对抗网络

2．2．2生成对抗网络的发展

2．2．3对抗强化学习

2．3强化学习在电商场景的应用

2．4生成对抗理论在电商场景的应用

2．5本章小结

第3章广告竞价排序问题描述

3．1电商广告业务介绍

3．1．1广告平台操作流程

3．1．2广告业务常用词

3．1．3广义第二价格

3．2广告竞价排序问题的决策视角

3．3广告竞价排序模型

3．3．1广告竞价排序模型架构

3．3．2广告竞价排序模型视角

3．4广告主决策模型

3．4．1广告主与广告平台

3．4．2决策模型及策略仿真

3．5本章小结

第4章基于深度对抗强化学习的广告排序决策模型

4．1问题建模

4．2广告主决策的行动器-评价器模型

4．2．1广告主决策模型架构

4．2．2基于LSTM的广告动态特征转移

4．2．3基于PPO的广告主决策模型

4．2．4基于GAE的优化的广告主决策模型

4．2．5模型优化技巧

4．3基于对抗强化学习的广告竞价排序仿真平台

4．3．1仿真平台模型

4．3．2预训练模型

4．3．3仿真平台算法

4．3．4激活函数的选择

4．4本章小结

第5章仿真平台实验验证

5．1数据集选择与问题分析

5．2数据预处理与特征提取

5．2．1数据预处理

5．2．2数据集分割及特征提取

5．3实验环境及参数的设置

5．3．2模型参数设置

5．4实验的设计与结果评价

5．4．1预训练结果分析

5．4．2状态转移模型训练结果分析

5．4．3Virtual-ADer训练结果分析

5．5本章小结

6．1论文工作总结

6．2未来工作展望

参考文献

致谢

攻读学位期间发表的学术论文

展开▼

著录项

作者
殷小静;
展开▼
作者单位

山东大学;

展开▼
授予单位山东大学;
学科软件工程
授予学位硕士
导师姓名崔立真;
年度 2021
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词

相似文献

中文文献
外文文献
专利

1. 基于深度强化学习的恶意软件混淆对抗样本生成 [J] . 严莹子 ,王小平 ,庄葛巍 . 计算机应用与软件 . 2022,第2期
2. 基于深度强化学习潜艇攻防对抗训练指挥决策研究 [J] . 郭洪宇 ,初阳 ,刘志 . 指挥控制与仿真 . 2022,第1期
3. 基于多智能体深度强化学习的空战博弈对抗策略训练模型 [J] . 孙彧 ,李清伟 ,徐志雄 . 指挥信息系统与技术 . 2021,第002期
4. 基于深度强化学习的黑盒对抗攻击算法 [J] . 李蒙 ,韩立新 . 计算机与现代化 . 2021,第004期
5. 基于多智能体深度强化学习的空战博弈对抗策略训练模型 [J] . 孙彧 ,李清伟 ,徐志雄 . 指挥信息系统与技术 . 2021,第002期
6. 基于Swarm仿真的发电商竞价问题研究 [C] . 任雪桂 ,郑华 . 中国高等学校电力系统及其自动化专业第二十五届学术年会 . 2009
7. 基于深度强化学习的展示广告实时竞价策略 [A] . 陈颖 . 2019

代理获取

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号