首页> 中文学位 >问答网站中基于混合模型的实时标签推荐
【6h】

问答网站中基于混合模型的实时标签推荐

代理获取

目录

摘要

第1章 绪论

1.1 课题背景

1.1.1 标签作用和意义

1.1.2 标签推荐

1.2 本文主要工作

1.3 本文结构

1.4 本章小结

第2章 相关研究综述

2.1 标签推荐中的问题

2.2 标签推荐相关技术

2.2.1 基于图的标签推荐

2.2.2 基于内容的标签推荐

2.2.3 混合模型的标签推荐

2.3 问答网站中基于问题内容的标签推荐

2.3.1 基于生成模型进行标签推荐

2.3.2 基于贝叶斯概率框架的图模型

2.3.3 基于混合模型的标签推荐

2.4 其它标注问题中的方法

2.5 本章小结

第3章 基于问题内容的标签抽取和扩展

3.1 问答网站中的标签推荐

3.2 问题内容中抽取标签

3.2.1 标题内容中抽取标签TFT

3.2.2 正文内容中抽取标签TFB

3.2.3 单词重组作为标签TFR

3.2.4 代码块中抽取标签TFC

3.2.5 模型算法

3.2.6 特征选取

3.3 基于问题内容的标签扩展

3.3.1 构建单词到标签的共现图模型

3.3.2 通过图模型扩展标签

3.4 目前方法的不足

3.5 本章小结

第4章 基于随机森林和排序函数的标签推荐

4.1 随机森林框架提升标签扩展效果

4.1.1 随机森林模型

4.1.2 随机森林框架融合图模型

4.2 排序函数对候选标签排序

4.2.1 标签的相关性

4.2.2 标签的描述能力

4.2.3 标签的层次

4.2.4 排序函数TagRec

4.3 模型实时性分析

4.4 本章小结

第5章 标签推荐框架设计与实验结果评测

5.1 标签推荐系统框架

5.2 数据描述与处理

5.2.1 数据集描述

5.2.2 文本预处理

5.3 实验结果评估与分析

5.3.1 标签抽取效果分析

5.3.2 标签扩展效果分析

5.3.3 排序函数效果分析

5.4 实验方法和结果

5.4.1 实验环境

5.4.2 评价标准

5.4.3 实验方法

5.4.4 实验结果

5.5 本章小结

第6章 总结与展望

6.1 工作总结

6.2 未来展望

参考文献

致谢

展开▼

摘要

Web2.0的兴起吸引了越来越多的用户为网站上传内容,在线问答网站是具有代表性的Web2.0网站之一,用户发布自己的问题,网站把这些问题分配给领域内的专家来解答。由于问题来自于用户,且多为非结构化的文本,因此问答网站要求用户为问题提供标签。然而用户在标注标签时有自己的理解和需求,导致即使对同一个问题,被标注的标签也会各式各样。
  因此研究者提出通过标签推荐来引导用户标注高质量的标签,这对于问答网站尤其重要,因为该类网站需要通过精准的标签描述问题,从而迅速找到能够解答问题的专家。本文从问题内容出发,提出一个实时的标签推荐框架,解决现有方法效率不高的问题,同时也能准确的推荐标签。
  该框架分为三大模块,标签抽取,标签扩展和标签排序。标签抽取是指从文本中抽取标签,本文提出了四个分类器,分别负责从标题内容中抽取标签,正文内容中抽取标签,代码块中抽取标签,单词重组作为标签,利用这些分类器,评估文本中的单词和词组为标签的概率;标签扩展是指找出没有在文本中出现的相关标签,本文使用单词到标签的图模型来扩展标签,由于单词到标签矩阵的稀疏性以及标签热度的不均匀,所以利用随机森林框架对文本进行聚类,在聚类之后的子空间内建立相应的图模型,从而能有效地推荐长尾标签。标签排序模块对标签抽取和标签扩展模块中得到的候选标签排序,本文提出了多个排序函数,从标签的相关度,质量,层次性三个角度评估候选标签,生成最终的标签推荐列表。
  从实验结果可知,本文提出的标签推荐框架充分利用了问题文本数据,可以进行实时标签推荐,不仅具有较高的召回率,而且给予高质量的标签更高的权重。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号