首页> 外文会议>International conference on theory and practice of digital libraries >Sub-document Timestamping: A Study on the Content Creation Dynamics of Web Documents
【24h】

Sub-document Timestamping: A Study on the Content Creation Dynamics of Web Documents

机译:子文档时间戳记:Web文档内容创建动态的研究

获取原文

摘要

The creation time of documents is an important kind of information in temporal information retrieval, especially for document clustering, timeline construction and search engine improvements. Considering the manner in which content on the Web is created, updated & deleted, the common assumption that each document has only one creation time is not suitable for Web documents. In this paper, we investigate to what extent this assumption is wrong. We introduce two methods to timestamp individual parts (sub-documents) of Web documents and analyze in detail the creation & update dynamics of three classes of Web documents.
机译:文档的创建时间是时间信息检索中的一种重要信息,特别是对于文档聚类,时间轴构建和搜索引擎改进而言。考虑到创建,更新和删除Web内容的方式,通常的假设是每个文档只有一个创建时间,这不适用于Web文档。在本文中,我们研究此假设在多大程度上是错误的。我们介绍了两种为Web文档的各个部分(子文档)添加时间戳的方法,并详细分析了三类Web文档的创建和更新动态。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号