【24h】

Symmetrization and Overfittingin Probabilistic Latent Semantic Analysis

机译:概率潜在语义分析中的对称化和过度拟合

获取原文
获取原文并翻译 | 示例
           

摘要

An algorithm is proposed for revealing latent user's interests from the observable protocol of usersbehavior, e.g., site visits. The algorithm combines the ideas of customer environment analysis and probabilis-tic latent semantic analysis. A quality criterion based on the classification of preliminarily labeled sites isintroduced to optimize the algorithm parameters and compare algorithms. The experiments show that thequality has an optimum by the essential parameters of the algorithm, however the attempt of too precise opti-mization can lead to overfitting.
机译:提出了一种算法,该算法用于从可观察到的用户行为协议(例如站点访问)中揭示潜在用户的兴趣。该算法结合了客户环境分析和概率潜在语义分析的思想。引入了基于初步标记位点分类的质量标准,以优化算法参数并比较算法。实验表明,通过算法的基本参数可以使质量达到最佳,但是过于精确的优化尝试可能会导致过拟合。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号