【24h】

On the Use of Topic Models for Word Completion

机译:关于主题模型在单词完成中的使用

获取原文
获取原文并翻译 | 示例

摘要

We investigate the use of topic models, such as probabilistic latent semantic analysis (PLSA) and latent Dirichlet allocation (LDA), for word completion tasks. The advantage of using these models for such an application is twofold. On the one hand, they allow us to exploit semantic or contextual information when predicting candidate words for completion. On the other hand, these probabilistic models have been found to outperform classical latent semantic analysis (LSA) for modeling text documents. We describe a word completion algorithm that takes into account the semantic context of the word being typed. We also present evaluation metrics to compare different models being used in our study. Our experiments validate our hypothesis of using probabilistic models for semantic analysis of text documents and their application in word completion tasks.
机译:我们调查了主题模型的使用,例如概率潜在语义分析(PLSA)和潜在Dirichlet分配(LDA),用于单词完成任务。在此类应用程序中使用这些模型的好处是双重的。一方面,它们允许我们在预测候选单词完成时利用语义或上下文信息。另一方面,已发现这些概率模型优于传统的潜在语义分析(LSA),可用于对文本文档进行建模。我们描述了一种单词补全算法,该算法考虑了所键入单词的语义上下文。我们还提出了评估指标,以比较研究中使用的不同模型。我们的实验验证了使用概率模型进行文本文档语义分析及其在单词完成任务中的应用的假设。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号