【24h】

Latent Concepts and the Number Orthogonal Factors in Latent Semantic Analysis

机译:潜在语义分析中的潜在概念和数量正交因子

获取原文
获取原文并翻译 | 示例

摘要

We seek insight into Latent Semantic Indexing by establishing a method to identify the optimal number of factors in the reduced matrix for representing a keyword. This method is demonstrated empirically by duplicating all documents containing a term t, and inserting new documents in the database that replace t with t'. By examining the number of times term t is identified for a search on term t' (precision) using differing ranges of dimensions, we find that lower ranked dimensions identify related terms and higher-ranked dimensions discriminate between the synonyms.
机译:我们通过建立一种方法来识别表示关键词的简化矩阵中的最佳因子,从而寻求对潜在语义索引的深入了解。通过复制所有包含项t的文档,然后在数据库中插入用t'替换t的新文档,以经验证明此方法。通过检查使用不同维度范围对词t'(精确度)进行搜索而确定词t的次数,我们发现排名较低的维度可以识别相关词语,而排名较高的维度可以区分同义词。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号