首页> 外文OA文献 >Un modèle de recherche d'information agrégée basée sur les réseaux bayésiens dans des documents semi-structurés
【2h】

Un modèle de recherche d'information agrégée basée sur les réseaux bayésiens dans des documents semi-structurés

机译:基于贝叶斯网络的半结构化文档中聚集信息的搜索模型

摘要

Nous proposons un modèle de recherche d'information basé sur les réseaux bayésiens. Dans ce modèle, la requête de l'utilisateur déclenche un processus de propagation pour sélectionner les éléments pertinents. Dans notre modèle, nous cherchons à renvoyer à l'utilisateur un agrégat au lieu d'une liste d'éléments. En fait, l'agrégat formulé à partir d'un document est considéré comme étant un ensemble d'éléments ou une unité d'information (portion d'un document) qui répond le mieux à la requête de l'utilisateur. Cet agrégat doit répondre à trois aspects à savoir la pertinence, la non-redondance et la complémentarité pour qu'il soit qualifié comme une réponse à cette requête. L'utilité des agrégats retournés est qu'ils donnent à l'utilisateur un aperçu sur le contenu informationnel de cette requête dans la collection de documents. Afin de valider notre modèle, nous l'avons évalué dans le cadre de la campagne d'évaluation INEX 2009 (utilisant plus que 2 666 000 documents XML de l'encyclopédie en ligne Wikipédia). Les expérimentations montrent l'intérêt de cette approche en mettant en évidence l'impact de l'agrégation de tels éléments.
机译:我们提出了一种基于贝叶斯网络的信息检索模型。在此模型中,用户请求触发传播过程以选择相关元素。在我们的模型中,我们试图向用户返回汇总而不是元素列表。实际上,由文档制定的汇总被认为是最能响应用户请求的一组元素或信息单元(文档的一部分)。此汇总必须响应三个方面,即相关性,非冗余和互补性,以便有资格作为对此请求的响应。返回的聚合的有用之处在于,它们为用户提供了文档集中该查询的信息内容的概述。为了验证我们的模型,我们在INEX 2009评估活动中对其进行了评估(使用了Wikipedia在线百科全书中的2,666,000多个XML文档)。实验通过强调这些元素聚合的影响来显示这种方法的兴趣。

著录项

  • 作者

    Naffakhi Najeh;

  • 作者单位
  • 年度 2013
  • 总页数
  • 原文格式 PDF
  • 正文语种 {"code":"fr","name":"French","id":14}
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号