首页> 外文期刊>Big Data, IEEE Transactions on >Kvasir: Scalable Provision of Semantically Relevant Web Content on Big Data Framework
【24h】

Kvasir: Scalable Provision of Semantically Relevant Web Content on Big Data Framework

机译:Kvasir:在大数据框架上可伸缩地提供语义相关的Web内容

获取原文
获取原文并翻译 | 示例
           

摘要

The Internet is overloading its users with excessive information flows, so that effective content-based filtering becomes crucial in improving user experience and work efficiency. Latent semantic analysis has long been demonstrated as a promising information retrieval technique to search for relevant articles from large text corpora. We build Kvasir, a semantic recommendation system, on top of latent semantic analysis and other state-of-the-art technologies to seamlessly integrate an automated and proactive content provision service into web browsing. We utilize the processing power of Apache Spark to scale up Kvasir into a practical Internet service. In addition, we improve the classic randomized partition tree to support efficient indexing and searching of millions of documents. Herein we present the architectural design of Kvasir, the core algorithms, along with our solutions to the technical challenges in the actual system implementation.
机译:Internet正在通过过多的信息流使用户过载,因此有效的基于内容的筛选对于改善用户体验和工作效率至关重要。长期以来,潜在语义分析已被证明是一种从大型文本语料库中搜索相关文章的有前途的信息检索技术。我们在潜在语义分析和其他最新技术的基础上构建了语义推荐系统Kvasir,以将自动化的主动式内容提供服务无缝集成到Web浏览中。我们利用Apache Spark的处理能力将Kvasir扩展为实用的Internet服务。此外,我们改进了经典的随机分区树,以支持对数百万个文档进行有效的索引和搜索。在这里,我们介绍了Kvasir的体系结构设计,核心算法,以及针对实际系统实施中的技术挑战的解决方案。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号