首页> 中文学位 >基于潜在主题的个性化搜索引擎用户建模
【6h】

基于潜在主题的个性化搜索引擎用户建模

代理获取

摘要

作为一种统计模型,主题模型可以有效地挖掘出隐含在文档中的有关主题,从而可以将高维度的词映射到低维度的主题空间中,达到数据降维的目的。降维后的数据可以转化为用户容易理解的信息,具有较高的可解读性。由于查询词较短且充满噪声,基准的LDA主题模型没有认识到其重要性,而且文本数据的稀疏性问题亟待解决。因此,本文试图将查询日志作为长期数据,对用户进行潜在主题建模,从而实现个性化搜索。
  本文首先将查询日志作为用户长期数据,通过查询日志中的点击文档和查询词构建用户文档;然后提出了一个新的主题模型SELDA模型,该模型从用户层面和用户行为层面构建,使学习到的主题中词关联性更强。SELDA主题模型是一种无监督自主学习模型,可以自动挖掘语料库中的潜在主题,是一种完全意义上的贝叶斯模型;最后,利用TMT主题建模工具训练和评价SELDA主题模型。
  实验结果表明,通过引入参数λ更新排名算法,对参数进行设置和取样,与基准LDA模型对比,个性化SELDA主题模型能够提供更好的结果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号