【24h】

Collaborative Filtering on Skewed Datasets

机译:偏斜数据集的协同过滤

获取原文

摘要

Many real life datasets have skewed distributions of events when the probability of observing few events far exceeds the others. This paper, we observed that in skewed datasets the state of the art collaborative filtering methods perform worse than a simple probabilistic model. Our test bench includes a real ad click stream dataset which is naturally skewed. The same conclusion obtained even from the popular movie rating dataset when we pose a binary prediction problem of whether a user will give maximum rating to a movie or not.
机译:当观察到少数事件的概率远远超过其他事件时,许多现实生活的数据集都会使事件的分布偏斜。在本文中,我们观察到,在偏斜的数据集中,最先进的协作过滤方法的性能比简单的概率模型差。我们的测试平台包括一个自然倾斜的真实广告点击流数据集。当我们提出一个关于用户是否将给电影最高评级的二元预测问题时,即使从受欢迎的电影评级数据集中也获得了相同的结论。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号