首页> 中文学位 >基于联邦检索思想的微博搜索研究
【6h】

基于联邦检索思想的微博搜索研究

代理获取

目录

声明

第一章 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.3 主要研究内容

1.4 本文组织结构

第二章 相关理论与技术

2.1 信息检索

2.2 联邦检索方法概述

2.3 本章小结

第三章 基于联邦检索思想的微博搜索框架

3.1 研究动机

3.2 微博数据预处理

3.3 数据集的描述

3.4 数据集的选择

3.5 结果合并

3.6 实验及评估

3.7 本章小结

第四章 融合微博作者权威度的结果合并算法

4.1 研究背景

4.2 研究方法

4.3 实验及评估

4.4 本章小结

第五章 基于联邦检索思想的微博搜索系统

5.1 系统总体概要

5.2 系统总体设计

5.3 系统演示与测试

5.4 本章小结

第六章 总结和展望

6.1 本文总结

6.2 研究展望

参考文献

附录 攻读硕士学位期间的研究成果

致谢

展开▼

摘要

随着Web2.0时代的到来,互联网中的各类应用越来越多,用户在网络中的参与度正在逐渐提高,人们所处的网络也正在朝着社会化网络迈进。微博服务就是社会化网络中最为典型的一个应用,它以内容精简、发布方便等特点吸引着越来越多的用户。随着微博用户数量的不断增加,用户在微博平台中生成的内容也呈指数级形式增长。然而,针对微博内容的搜索还是采用传统的集中式检索模式,带来了一定的问题。首先,由于微博数据量庞大,直接搜索全部微博会比较耗时,降低用户的搜索体验;其次,微博主题太多,采用集中式检索有可能造成准确率不高;最后,集中式检索只能使用一种检索模型,而联邦检索可以针对不同数据集提供不同的检索模型,灵活性更强。联邦检索是信息检索的一个重要分支研究领域,它可以分布式地搜索不同的数据集,解决了集中式检索中效率、准确率均不高的问题。联邦检索首先会判断每个数据集和查询词的相关性,然后将查询词送往相关性较大的数据集进行检索,最后将检索结果合并后返回给用户。因为查询的数据集都相对相关,在搜索结果准确率方面比集中式检索相对要高,同时,解决了数据集过于庞大,无法有效检索的问题。
  本研究提出了一种基于联邦检索思想的微博搜索技术。该技术将联邦检索的思想应用到微博搜索领域,同时考虑到微博文本的特殊性,融入微博作者的权威度因子,使文档排序得分的计算更加精确。在真实微博数据集上的实验结果表明,本文所提出的方法能提高微博搜索的准确率。主要包括:⑴建立适应微博搜索的联邦数据集,生成每个数据集的数据集描述;采用数据集选择方法,根据已经建立好的数据集描述,计算查询词和每个数据集的匹配得分,将数据集按照相关性进行排序,选择若干相关性较大的数据集;将查询词送往被选择的数据集进行搜索;合并不同数据集返回的结果,形成单一搜索结果列表,并返回给用户。⑵提出了一种融合微博作者权威的结果合并方法。实验结果表明,与以往的结果合并方法相比,本文所提出的方法能有效提高搜索结果的准确率。⑶设计实现了基于联邦检索思想的微博搜索原型系统。系统主要包括微博索引建立、普通搜索以及联邦检索三大功能模块,最后本文对系统进行了演示。

著录项

  • 作者

    孙刚杰;

  • 作者单位

    湖南科技大学;

  • 授予单位 湖南科技大学;
  • 学科 计算机科学与技术
  • 授予学位 硕士
  • 导师姓名 周栋;
  • 年度 2017
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.13;
  • 关键词

    网络微博; 信息搜索; 数据挖掘; 程序语言;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号