首页> 外文OA文献 >Summaries on the fly: Query-based extraction of structured knowledge from web documents
【2h】

Summaries on the fly: Query-based extraction of structured knowledge from web documents

机译:动态摘要:从Web文档中基于查询的结构化知识提取

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

A large part of Web resources consists of unstructured textual content. Processing and retrieving relevant content for a particular information need is challenging for both machines and humans. While information retrieval techniques provide methods for detecting suitable resources for a particular query, information extraction techniques enable the extraction of structured data and text summarization allows the detection of important sentences. However, these techniques usually do not consider particular user interests and information needs. In this paper, we present a novel method to automatically generate structured summaries from user queries that uses POS patterns to identify relevant statements and entities in a certain context. Finally, we evaluate our work using the publicly available New York Times corpus, which shows the applicability of our method and the advantages over previous works. The final publication is available at Springer via https://doi.org/10.1007/978-3-642-39200-9_22
机译:Web资源的很大一部分由非结构化的文本内容组成。对于特定的信息需求而言,处理和检索相关内容对机器和人类都具有挑战性。信息检索技术提供了用于检测特定查询的合适资源的方法,而信息提取技术则可以提取结构化数据,而文本摘要则可以检测重要的句子。但是,这些技术通常不考虑特定的用户兴趣和信息需求。在本文中,我们提出了一种新颖的方法,可以根据用户查询自动生成结构化摘要,该查询使用POS模式在特定上下文中标识相关语句和实体。最后,我们使用可公开获得的《纽约时报》语料库评估我们的工作,这显示了我们方法的适用性以及与以前工作相比的优势。最终出版物可通过https://doi.org/10.1007/978-3-642-39200-9_22在Springer上获得。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号