首页> 外文会议> >A Web warehouse system for semi-automatically gathering and managing online news
【24h】

A Web warehouse system for semi-automatically gathering and managing online news

机译:一个用于半自动收集和管理在线新闻的Web仓库系统

获取原文
获取外文期刊封面目录资料

摘要

In this paper we propose a Web warehouse system that gathers and manages online news in a semi-automatic fashion, serving as intermediate information repository for a given user community. We describe its architecture and an ontology-based, focused crawler for automatically collecting relevant news documents. We further discuss the problem of efficient management of the hit frequency profile for all visited news stories and propose a randomized data structure, ABF-Aging Bloom Filter, to cope with this problem. We demonstrate that the proposed system can save a good deal of Web traffic and online time when individual users try to search and retrieve the relevant online news.
机译:在本文中,我们提出了一个Web仓库系统,该系统以半自动方式收集和管理在线新闻,用作给定用户社区的中间信息存储库。我们描述了它的体系结构和一个基于本体的,集中的爬虫,用于自动收集相关新闻文档。我们进一步讨论了对所有访问过的新闻报道的命中频率配置文件进行有效管理的问题,并提出了一种随机数据结构ABF-Aging Bloom Filter来解决此问题。我们证明,当单个用户尝试搜索和检索相关的在线新闻时,所提出的系统可以节省大量的Web流量和在线时间。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号