【24h】

Revealing Historical Events Out of Web Archives

机译:从网络档案中揭示历史事件

获取原文

摘要

As the living Web expands, worldwide volumes of Web archives constantly increase, making difficult to identify relevant archived contents. Here we propose an application for detecting historical events out of a corpus of Web archives and based on an entity called Web Fragment: a semantic and syntactic subset of a given Web page. The Web fragment has the particularity to be indexed by its edition date instead of its archiving date. We apply our framework on an archived Moroccan forum and witness how it reacted to the Arab Spring at the end of 2010.
机译:随着实时Web的扩展,全球范围内的Web存档数量不断增加,从而难以识别相关的存档内容。在这里,我们提出了一个用于从Web档案库中检测历史事件的应用程序,该应用程序基于一个称为Web Fragment的实体:给定Web页面的语义和句法子集。 Web片段具有通过其编辑日期而不是其存档日期进行索引的特殊性。我们在一个存档的摩洛哥论坛上应用了我们的框架,并见证了该框架对2010年底的“阿拉伯之春”的反应。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号