声明
第1章 绪论
1.1研究背景
1.2研究意义
1.3研究内容与组织结构
1.3.1研究内容
1.3.2本文主要贡献与创新
1.3.3组织结构
第2章 文献综述
2.1传统推荐算法
2.2推荐算法瓶颈问题研究
2.2.1冷启动问题
2.2.2数据稀疏性问题
2.2.3多样性和准确性平衡问题
2.2.4动态实时性问题
2.3深度强化学习在推荐系统中的应用
2.4本章小结
第3章 相关理论与模型
3.1深度学习理论基础与模型
3.1.1深度学习简介
3.1.2神经网络
3.1.3卷积神经网络(Convolutional Neural Networks,CNN)
3.1.4Word2vec词向量模型
3.2强化学习理论基础与模型
3.2.1强化学习简介
3.2.2马尔可夫决策过程
3.2.3强化学习主要算法
3.3深度强化学习理论基础与模型
3.4上下文置信区间推荐算法(LinUCB)
3.6本章小结
第4章 基于深度强化学习的新闻推荐模型
4.1引言
4.2总体框架
4.3新闻推荐损失函数
4.4深度Q网络设计与训练
4.4.1输入特征设计
4.4.2深度Q网络设计
4.4.2模型训练
4.5本章小结
第5章 实验及结果分析
5.1实验数据与处理
5.2推荐算法评估指标
5.3对比方案设计
5.4.1Q值表现对比
5.4.2准确性和多样性对比
5.4.3长期推荐性能对比
5.5本章小结
第6章 总结与展望
6.1本文总结
6.2未来展望
参考文献
致谢
个人简历 在读期间发表的学术论文与研究成果
对外经济贸易大学;