首页> 外国专利> Selective latent semantic indexing method for information retrieval applications

Selective latent semantic indexing method for information retrieval applications

机译:信息检索应用中的选择性潜在语义索引方法

摘要

A term-by-document (or part-by-collection) matrix can be used to index documents (or collections) for information retrieval applications. Reducing the rank of the indexing matrix can further reduce the complexity of information retrieval. A method for index matrix rank reduction can involve computing a singular value decomposition and then retaining singular values based on the singular values corresponding to singular values of multiple topics. The expected singular values corresponding to a topic can be determined using the roots of a specially formed characteristic polynomial. The coefficients of the special characteristic polynomial can be based on computing the determinants of a Gram matrix of term (or part) probabilities, a method of recursion, or a method of recursion further weighted by the probability of document (or collection) lengths.
机译:每个文档(或集合的一部分)术语矩阵可用于为信息检索应用程序的文档(或集合)建立索引。降低索引矩阵的等级可以进一步降低信息检索的复杂度。用于索引矩阵秩降低的方法可以包括计算奇异值分解,然后基于与多个主题的奇异值相对应的奇异值来保留奇异值。可以使用特殊形成的特征多项式的根来确定与主题相对应的预期奇异值。特殊特征多项式的系数可以基于计算项(或部分)概率的Gram矩阵的行列式,递归方法或进一步由文档(或集合)长度的概率加权的递归方法。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号