一种融合聚类和时间信息的微博排序新方法

卫冰洁; 史亮; 王斌

首页> 中文期刊>中文信息学报 >一种融合聚类和时间信息的微博排序新方法

一种融合聚类和时间信息的微博排序新方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

随着微博的快速发展,微博检索已经成为近年来研究领域的热点之一.微博检索与传统文本检索在两个方面明显不同:一是微博具有自己的特点,表现在文本短和内容中具有主题概括词(*称为Hashtag);二是微博排序中除了考虑文本和语义相似度,还需考虑时间信息.根据这两点区别,该文在统计语言模型的基础上,使用聚类进行文本扩展,并将Hashtag信息运用到聚类过程中.同时,因为微博数据集中具有Hashtag的微博个数不超过13％,针对这一现象,该文还提出了一种扩展微博Hashtag的方法,最终提出了基于聚类的三个模型.然后通过定义文档先验将时间信息加入到提出的三个检索模型中,得到融入聚类和时间信息的三个模型.最后基于TRECMicroblog数据的实验结果证明,融合聚类信息和时间信息的模型在MAP和P@30上有明显提高,分别提高7.1％和11.6％.

著录项

来源
《中文信息学报》|2015年第3期|177-183,189|共8页
作者
卫冰洁; 史亮; 王斌;
展开▼
作者单位

中国科学院计算技术研究所,北京100190;

国家计算机网络应急技术处理协调中心,北京100029;

国家计算机网络应急技术处理协调中心,北京100029;

中国科学院信息工程研究所,北京100093;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
微博检索; Hashtag; 聚类; 时间; 语言模型;
入库时间 2022-08-18 06:08:24

相似文献

中文文献
外文文献
专利

1. 一种聚类后排序的灰色聚类评价方法 [J] . 李志亮 ,罗芳 ,阮群生 . 宜宾学院学报 . 2015,第012期
2. 融合聚类算法和缺陷预测的测试用例优先排序方法 [J] . 肖蕾 ,陈荣赏 ,缪淮扣 . 计算机科学 . 2021,第005期
3. 一种基于动态步长的微博搜索排序算法 [J] . 张妍琰 ,姚远 ,张娜 . 湖北大学学报（自然科学版） . 2016,第003期
4. 一种基于BP神经网络的新浪微博实时搜索排序算法 [J] . 王旭波 . 现代计算机（专业版） . 2014,第007期
5. 一种基于模糊聚类模型的动量轮健康性排序方法 [J] . 季业 ,崔振 ,王雪涛 . 中国空间科学技术 . 2020,第003期
6. 风险可能数：一种基于最大信息熵理论的风险度量和风险排序新方法 [C] . 王贵宝 ,黄洪钟 ,张小玲 . 中国航空学会可靠性工程专业委员会第十一届学术年会 . 2008
7. 一种聚类算法的并行化改进及其在微博用户聚类中的应用 [A] . 张睿欣 . 2013

一种融合聚类和时间信息的微博排序新方法

摘要

著录项

相似文献

相关主题

期刊订阅