首页> 外文OA文献 >Object search: supporting structured queries in web search engines
【2h】

Object search: supporting structured queries in web search engines

机译:对象搜索:支持Web搜索引擎中的结构化查询

摘要

As the web evolves, increasing quantities of structured information is embeddedin web pages in disparate formats. For example, a digital camera???s description may include its price and megapixels whereas a professor???s description may includeher name, university, and research interests. Both types of pages mayinclude additional ambiguous information. General search engines (GSEs) do not support queries over these types of data because they ignore the web document semantics. Conversely, describing requisite semantics through structuredqueries into databases populated by information extraction (IE) techniques are expensive and not easily adaptable to new domains. This paper describes a methodology for rapidly developing search engines capable of answering structured queries over unstructured corpora by utilizing machine learning to avoidexplicit IE. We empirically show that with minimum additional human effort, our system outperforms a GSE with respect to structured queries with clear object semantics.
机译:随着网络的发展,越来越多的结构化信息以不同的格式嵌入到网页中。例如,数码相机的描述可能包括其价格和百万像素,而教授的描述可能包括她的姓名,大学和研究兴趣。两种类型的页面都可能包含其他不明确的信息。通用搜索引擎(GSE)不支持对这些类型的数据进行查询,因为它们忽略了Web文档的语义。相反,通过结构化查询向由信息提取(IE)技术填充的数据库中描述必要的语义是昂贵的,并且不容易适应新领域。本文介绍了一种用于快速开发搜索引擎的方法,该方法可以通过利用机器学习来避免显式IE来回答非结构化语料库上的结构化查询。我们凭经验表明,在具有清晰对象语义的结构化查询方面,我们的系统只需花费最少的人力即可胜过GSE。

著录项

  • 作者

    Pham Cuong K.;

  • 作者单位
  • 年度 2010
  • 总页数
  • 原文格式 PDF
  • 正文语种 {"code":"en","name":"English","id":9}
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号