【24h】

Streaming Pointwise Mutual Information

机译:流式逐点相互信息

获取原文

摘要

Recent work has led to the ability to perform space efficient, approximate counting over large vocabularies in a streaming context. Motivated by the existence of data structures of this type, we explore the computation of associativity scores, otherwise known as pointwise mutual information (PMI), in a streaming context. We give theoretical bounds showing the impracticality of perfect online PMI computation, and detail an algorithm with high expected accuracy. Experiments on news articles show our approach gives high accuracy on real world data.
机译:最近的工作使得能够在流上下文中对大型词汇进行空间有效的近似计数。由于存在这种类型的数据结构,我们在流环境中探索了关联性得分的计算,也称为点向互信息(PMI)。我们给出了理论界线,显示了完美的在线PMI计算的不切实际性,并详细介绍了具有较高预期准确性的算法。新闻报道的实验表明,我们的方法对真实世界的数据具有很高的准确性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号