首页> 中文学位 >基于主题模型的学术论文推荐系统研究
【6h】

基于主题模型的学术论文推荐系统研究

代理获取

目录

声明

摘要

第1章 绪论

1.1 课题研究背景和意义

1.2 推荐系统国内外研究现状

1.3 论文的主要工作和组织结构

第2章 相关理论概述

2.1 引言

2.2 主题模型发展历史

2.3 推荐方法简介

2.3.1 基于人口统计学的推荐

2.3.2 基于内容的推荐

2.3.3 基于协同过滤的推荐

2.3.4 混合推荐方法

2.4 推荐结果评估

第3章 基于LDA主题模型的学术论文推荐

3.1 引言

3.2 LDA主题模型

3.2.1 LDA的生成过程及图模型表示

3.2.2 主题模型中的推断方法

3.3 实验步骤

3.3.1 实验环境

3.3.2 数据预处理

3.3.3 基于主题分布相似性的推荐

3.3.4 对比实验

3.3.5 惊喜度评估

3.4 实验结果

3.5 本章小结

第4章 基于排序主题模型CTM的学术论文推荐

4.1 引言

4.2 CTM关联主题模型

4.2.1 变分方法后验推断

4.2.2 参数估计

4.3 实验步骤

4.3.1 实验环境

4.3.2 数据处理

4.3.3 基于主题直接关联度的推荐

4.3.4 基于主题直接关联度的推荐

4.4 实验结果

4.5 本章小结

第5章 基于相关反馈的学术论文推荐

5.1 引言

5.2 相关反馈

5.3 用户形象形成

5.4 实验步骤

5.4.1 实验环境

5.4.2 基于预测评分的推荐

5.4.3 基于相关反馈的推荐

5.5 实验结果

5.6 本章小结

第6章 总结与展望

6.1 论文的贡献与创新

6.2 下一步研究工作

参考文献

致谢

展开▼

摘要

学术论文推荐是推荐系统的一个应用方向,可以帮助用户在数千万的文档中找出那些需要的论文。它可以通过对用户的历史访问记录进行分析,挖掘出用户潜在的需求,并向其推荐与之相关的内容,使得用户查找论文的过程变得简洁、方便。
   鉴于被推荐的物品(学术论文)的特殊性,仅仅使用准确度来衡量推荐结果显然不足以满足不同用户的各种需求。本实验将提高推荐结果的惊喜度作为主要目标。所谓惊喜度是指发现那些用户并不了解却确实需要的物品的能力。
   本文采用基于主题模型的方法,在文档中单词分布已知的情况下,计算每篇文档主题分布的后验概率,挖掘出其潜在主题与结构。它不再像传统的空间向量模型那样,只单纯的考虑文档在词典空间上的维度。这种单纯的基于词频统计的方法,无法捕捉文档内部以及文档间的统计特征,也无法捕捉到文档的语义特征。而主题模型则是引入了了主题空间,实现了文档在主题空间上的表示,不仅可以捕捉到文档内的语义信息,从而发现文档间潜在的联系,而且给于用户和论文推荐很好地解释性。
   文章主要内容一共分为三个部分。基于LDA主题模型的推荐,是根据文档在主题上的分布概率进行推荐的。这种在主题层面上的推荐可以有效的解决一词多义,异形同义等问题。这对分析文档内容,抽取文档特征具有很重要的意义。而且与基于TF-IDF的推荐相比,期望得到惊喜度更高的推荐。基于CTM关联主题模型的推荐,在LDA的基础上,考虑到了主题之间的关联,能够更有效的发觉文档间的潜在关系,使惊喜度得到进一步的提高。基于相关反馈的推荐在之前的基础上加入了用户评分,系统可根据用户的反馈形成用户形象,从而对于不同用户给予不同的推荐,使得推荐结果更加个性化。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号