首页> 外文会议>ACM/IEEE-CS Joint Conference on Digital Libraries >Avoiding the Drunkard's search: Investigating collection strategies for building a Twitter dataset
【24h】

Avoiding the Drunkard's search: Investigating collection strategies for building a Twitter dataset

机译:避免醉汉的搜索:研究用于构建Twitter数据集的收集策略

获取原文

摘要

We investigate methods for collecting data to form an archive on the debate within Twitter surrounding the UK's inclusion in the EU. We use three strategies, gathering data using hashtags, extracting data from the random stream and collecting from users known to be discussing the debate. We explore the various bias in the resulting datasets.
机译:我们研究了收集数据的方法,以形成有关Twitter围绕英国被纳入欧盟的辩论的存档。我们使用三种策略:使用主题标签收集数据,从随机流中提取数据以及从已知正在讨论辩论的用户收集数据。我们探索了所得数据集中的各种偏差。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号