首页> 外文会议>Focused Access to XML Documents >Entity Ranking from Annotated Text Collections Using Multitype Topic Models
【24h】

Entity Ranking from Annotated Text Collections Using Multitype Topic Models

机译:使用多类型主题模型的带注释文本集合中的实体排名

获取原文
获取原文并翻译 | 示例

摘要

Very recently, topic model-based retrieval methods have produced good results using Latent Dirichlet Allocation (LDA) model or its variants in language modeling framework. However, for the task of retrieving annotated documents when using the LDA-based methods, some post-processing is required outside the model in order to make use of multiple word types that are specified by the annotations. In this paper, we explore new retrieval methods using a 'multi-type topic model' that can directly handle multiple word types, such as annotated entities, category labels and other words that are typically used in Wikipedia. We investigate how to effectively apply the multitype topic model to retrieve documents from an annotated collection, and show the effectiveness of our methods through experiments on entity ranking using a Wikipedia collection.
机译:最近,在语言建模框架中使用潜在狄利克雷分配(LDA)模型或其变体,基于主题模型的检索方法已产生了良好的效果。但是,对于使用基于LDA的方法时检索带注释的文档的任务,需要在模型外部进行一些后处理,以便使用由注释指定的多个单词类型。在本文中,我们探索了一种使用“多类型主题模型”的新检索方法,该模型可以直接处理多种单词类型,例如带注释的实体,类别标签和Wikipedia中通常使用的其他单词。我们研究如何有效地使用多类型主题模型来从带注释的集合中检索文档,并通过使用Wikipedia集合进行实体排名实验来证明我们的方法的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号