首页> 中文学位 >社交媒体中的信息检索与传播分析
【6h】

社交媒体中的信息检索与传播分析

代理获取

目录

封面

声明

目录

中文摘要

英文摘要

第一章绪论

1 .1 研究背景

1 .2 研究问题

1 .3 相关研究

1 .4 研究内容与方法

1 .5 本文主要贡献

1 .6 本文结构

第二章利用结构化信息的Twitter检索

2 .1 引言

2 .2 相关工作

2.3 Twitter积 木 (TBB)

2 . 4 基于Twitter积木的tw eet排序学习

2.5 Twitter信息检索实验

2 .6 小结

第三章 Twitter观点检索

3 .1 引言

3 .2 相关工作

3 . 3 基于排序学习的Twitter观点检索框架

3 .4 社交媒体特征

3 .5 观点化特征

3.6 Twitter观点检索实验

3 .7 小结

第 四 章 Twitter中传播观点的发现

4 .1 引言

4 .2 相关工作

4.3 Twitter传播观点检索实验数据

4 . 4 基于排序学习的Twitter传播观点检索框架

4 .5 传播度特征

4 .6 观点化特征

4 .7 文本质量特征

4.8 Twitter传播观点检索实验

4 .9 小结

第 五 章 Twitter中信息传播者的发现

5 .1 引言

5 .2 相关工作

5 . 3 基于排序学习的Twitter信息传播者发现框架

5 .4 转发历史特征

5 .5 用户特征

5 .6 用户活跃时间特征

5 .7 用户兴趣特征

5.8 Twitter信息传播者发现实验

5 .9 小结

第六章总结与展望

6 .1 工作总结

6 .2 工作展望

致谢

参考文献

作者在学期间取得的学术成果

展开▼

摘要

现在的互联网上社交媒体随处可见,这给信息检索和传播分析工作带来了机遇与挑战。本文主要围绕在社交媒体中如何找到重要的信息以及信息是如何传播的展开。我们将Twitter作为研究对象,因为它是目前最著名的社交媒体之一,并且数据是公开的。这样从隐私的角度考虑,获取研究数据变得容易且能很好的为研究任务服务。信息检索的主要任务是在文档集合中,找到与给定话题相关的客观文本或主观文本。Twitter是一个丰富的包含各种话题及其评论信息的资源库,本文将探讨如何在Twitter中找到相关的信息。但是tweet的短小化和非正式的文本特点,使得Twitter中的检索不同于以往的检索任务。本文通过研究tweet文本特点和特有的Twitter社交媒体属性帮助Twitter检索。另外,Twitter中信息的传播是一种普遍现象且与消息的质量相关。因此,我们从tweet本身和用户的角度,研究哪些因素影响了tweet的转发和人的转发行为。本研究主要内容包括:
  ⑴利用结构化信息的Twitter检索:Twitter检索是在Twitter中找到与给定话题相关的的任务。绝大部分的Twitter检索系统在构造检索模型时一般都认为tweet是一个平面文本,但用户在编辑tweet时的一些习惯使得tweet文本呈现结构化的特点。这种结构化是通过一些不同的文本积木块组合而成,积木类型具体包括平面文本、核心词、链接、提及等。每一种积木都有自已独特的本质,一系列积木的排序组合又反映了一定的话语转换。以往的研究发现,通过开发文本的结构信息能够帮助结构化文本的检索(例如,网页检索)。本工作通过积木结构开发tweet的结构化信息,以此帮助Twitter检索。我们利用积木及其排列组合开发了一系列特征,并将其应用到排序学习的框架中。我们发现利用结构化tweet的方法进行检索能够达到目前最好的Twitter检索方法效果,将结构化tweet的方法和其他社交媒体特征一起使用能够进一步提高Twitter的检索效果。
  ⑵Twitter观点检索:观点检索是在数据中找到对指定话题表达正面或反面观点的加如的任务。人们几乎在Twitter中表达了任何话题的观点,使其成为一个丰富的观点资源库。但是Twitter中也存在大量的垃圾信息和各种不同类型的文本,使得Twitter中的观点检索充满挑战。我们提出了如何利用tweet的社交媒体信息和文本结构化信息的方法帮助Twitter的观点检索。特别的,基于排序学习,我们发现tweet的用户信息(如用户包含朋友的数目)、tweet文本本身的结构信息和观点化程度影响着tweet的排序结果。实验结果表明社交媒体信息能够帮助Twitter的观点检索。基于无监督学习评价tweet观点化程度,并以此开发特征形成的检索方法能够到达手工标注tweet的有监督方法的检索效果,且这种方法能够帮助观点检索中话题依赖问题的解决。最后,我们在重新标注的TREC Tweets2011数据集上进一步验证了我们Twitter观点检索方法的有效性。
  ⑶Twitter中传播观点的发现:Twitter已经变成人们收集观点做出决策的重要资源,但是数量众多且差异巨大的观点严重影响了人们使用这些资源的效果。本文我们考虑了如何在Twitter中找到传播观点的任务一tweet不仅表达了对某些话题的观点,且这个tweet在未来会被转发。利用排序学习模型,我们开发了一系列特征,具体包括tweet的传播度特征、观点化特征和文本质量特征。实验结果证明了我们开发的特征对于Twitter中传播观点的发现是有效的,并且将所有特征整合的方法在发现效果上能够显著优于BM25方法和Twitter观点检索方法。最后,我们发现我们的方法在预测观点传播上可以达到人预测的水平。
  ⑷Twitter中信息传播者的发现:Twitter和其它社交网络中一个重要的交流机制就是消息传播一人们分享其他人创建的消息。虽然目前有许多工作研究了Twitter中的tweet是如何传播的(转发),但是一个未解决的问题是到底谁会转发给定的tweet。这里我们考虑了在Twitter中给定一条_如,发现作者的粉丝中谁会转发。利用排序学习模型的框架,我们设计了一些特征,包括用户历史的转发信息,用户自身的社交媒体特征,用户使用Twitter的活跃时间,以及用户的个人兴趣。我们发现经常转发和提及作者的粉丝和与作者有相同兴趣爱好的人最有可能成为信息传播者。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号