问答网站中基于混合模型的实时标签推荐

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

Web2.0的兴起吸引了越来越多的用户为网站上传内容，在线问答网站是具有代表性的Web2.0网站之一，用户发布自己的问题，网站把这些问题分配给领域内的专家来解答。由于问题来自于用户，且多为非结构化的文本，因此问答网站要求用户为问题提供标签。然而用户在标注标签时有自己的理解和需求，导致即使对同一个问题，被标注的标签也会各式各样。
　　因此研究者提出通过标签推荐来引导用户标注高质量的标签，这对于问答网站尤其重要，因为该类网站需要通过精准的标签描述问题，从而迅速找到能够解答问题的专家。本文从问题内容出发，提出一个实时的标签推荐框架，解决现有方法效率不高的问题，同时也能准确的推荐标签。
　　该框架分为三大模块，标签抽取，标签扩展和标签排序。标签抽取是指从文本中抽取标签，本文提出了四个分类器，分别负责从标题内容中抽取标签，正文内容中抽取标签，代码块中抽取标签，单词重组作为标签，利用这些分类器，评估文本中的单词和词组为标签的概率;标签扩展是指找出没有在文本中出现的相关标签，本文使用单词到标签的图模型来扩展标签，由于单词到标签矩阵的稀疏性以及标签热度的不均匀，所以利用随机森林框架对文本进行聚类，在聚类之后的子空间内建立相应的图模型，从而能有效地推荐长尾标签。标签排序模块对标签抽取和标签扩展模块中得到的候选标签排序，本文提出了多个排序函数，从标签的相关度，质量，层次性三个角度评估候选标签，生成最终的标签推荐列表。
　　从实验结果可知，本文提出的标签推荐框架充分利用了问题文本数据，可以进行实时标签推荐，不仅具有较高的召回率，而且给予高质量的标签更高的权重。

著录项

作者
曹擎宇;
展开▼
作者单位

浙江大学;

展开▼
授予单位浙江大学;
学科计算机应用技术
授予学位硕士
导师姓名宋明黎,王灿;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类程序设计;
关键词
逻辑回归; 图模型; 相关度排序; 问答网站; 标签推荐框架;

相似文献

中文文献
外文文献
专利

1. 基于标签的教育资源管理与推荐模型构建——来自社会化标注网站的启示 [J] . 白雪 ,赵蔚 ,姜强 . 现代教育技术 . 2014,第005期
2. 一种基于混合粒度的微博用户标签推荐模型 [J] . 张瑞 ,金志刚 ,王颖 . 计算机科学 . 2016,第004期
3. 基于混合型的Web实时推荐模型研究 [J] . 刘敏娴 ,马强 . 计算机工程与设计 . 2011,第010期
4. 基于用户行为的产品相似性推荐模型及用户、产品标签化推荐模型 [J] . 陈宸 . 科技传播 . 2018,第015期
5. 开源问答服务系统专家推荐混合模型 [J] . 赵文普 ,赵逢禹 ,刘亚 . 计算机应用与软件 . 2018,第006期
6. 中文博客标签调查分析及标签推荐模型的研究 [C] . 宋洪鑫 ,李蕾 ,刘冬雪 . 第五届全国青年计算语言学研讨会(YWCL 2010) . 2010
7. 基于混合模型的科技论文标签推荐方法研究 [A] . 郭彦伟 . 2016

问答网站中基于混合模型的实时标签推荐

目录

摘要

著录项

相似文献

相关主题

期刊订阅