首页> 外文会议>IEEE International Workshop on Machine Learning for Signal Processing >TEMPORAL ANALYSIS OF TEXT DATA USING LATENT VARIABLE MODELS
【24h】

TEMPORAL ANALYSIS OF TEXT DATA USING LATENT VARIABLE MODELS

机译:使用潜在变量模型的文本数据的时间分析

获取原文

摘要

Detecting and tracking of temporal data is an important task in multiple applications. In this paper we study temporal text mining methods for Music Information Retrieval. We compare two ways of detecting the temporal latent semantics of a corpus extracted from Wikipedia, using a stepwise Probabilistic Latent Semantic Analysis (PLSA) approach and a global multi-way PLSA method. The analysis indicates that the global analysis method is able to identify relevant trends which are difficult to get using a step-by-step approach. Furthermore we show that inspection of PLSA models with different number of factors may reveal the stability of temporal clusters making it possible to choose the relevant number of factors.
机译:检测和跟踪时间数据是多个应用程序中的重要任务。在本文中,我们研究了音乐信息检索的时间文本挖掘方法。我们使用逐步概率潜伏语义分析(PLSA)方法和全局多路PLSA方法,比较两种方法可以检测从维基百科提取的语料库的时间潜在语义。分析表明,全局分析方法能够识别难以使用逐步方法难以获得的相关趋势。此外,我们表明,对不同因素数量不同的PLSA模型的检查可能会揭示时间簇的稳定性,使得可以选择相关的因素数量。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号