...
首页> 外文期刊>電子情報通信学会論文誌 >多型トピックモデルを用いたアノテーション付き文書に村する検索手法
【24h】

多型トピックモデルを用いたアノテーション付き文書に村する検索手法

机译:利用多态主题模型检索带注释文档的方法

获取原文
获取原文并翻译 | 示例

摘要

最近,確率的トピックモデルに基づく情報検索手法が提案され,言語モデルの枠組みにおいて潜在rn的デイリクレ配分法(LDA)またはその変形を用いた実験で良好な結果が報告されている,しかしながら,アノrnテーション付き文書を検索するタスクに対しては,LDAに基づく手法ではアノテーションによって特定されたrn属性型を直接利用することができない.本論文では,アノテーション付き文書コレクションのための新たなアrnドホック検索手法を提案する.提案手法は多型トピックモデルに基づく.これは,Wikipediaにおけるエンティrnティ名,カテゴリーラベル,その他の語を典型とする,複数種の単語型を直接扱うことができる.この多型トrnピックモデルをアドホック検索に通用する方法を新たに提案し,Wikipediaを用いたエンティティ検索に関するrn実験においてLDAに基づく従来手法よりも統計的に有意な差で優れていることを示す.
机译:近来,已经提出了一种基于概率主题模型的信息检索方法,并且在语言模型的框架中使用潜在的rnayder Dirichlet分配方法(LDA)或其变体进行的实验已经报告了良好的结果。基于LDA的方法不能直接将注释指定的rn属性类型用于带引号的文档检索任务。在本文中,我们提出了一种新的Arn hoc搜索方法,用于带注释的文档收集。所提出的方法基于多态主题模型。它可以直接处理多种单词类型,通常是Wikipedia实体名称,类别标签和其他单词。我们提出了一种将这种多态trn pick模型应用于ad hoc搜索的新方法,并表明它在使用Wikipedia进行实体搜索的实验中优于基于LDA的传统方法,具有统计上的显着差异。 。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号