首页> 外文期刊>電子情報通信学会技術研究報告 >Some extensions of DLT priority sampling: Covariance and Sliding Window
【24h】

Some extensions of DLT priority sampling: Covariance and Sliding Window

机译:DLT优先级采样的一些扩展:协方差和滑动窗口

获取原文
获取原文并翻译 | 示例
       

摘要

Duffield,Lund,Thorupが提案した優先サンプリングは、nアイテムからなる重み付きの大きなストリームの任意の部分集合の重みを、限られた数k個のサンプルだけから推定する。この手法は同じサンプル数たの手法の中で推定量の分散の合計の意味で準最適であることが、Szegedyにより示されている。本報告では、優先サンプリングの二つの拡張を与える。まず、ベクトルで重み付けられたストリームに対するサンプリング手法を与える。これは、ある準最適性を満たす。この手法の応用として、一つのアイテムに関連づけられた2種類の重みの共分散を推定する優先サンプリングを与える。そして、最近のある一定数のアイテムからなるスライディング窓の中の任意の重み部分和を推定する変形された優先サンプリングを与える。これら提案手法に対して実験的解析を行う。%The priority sampling scheme, proposed by Duffield, Lund, and Thorup, estimates the weight of an arbitrary subset of a large weighted stream of n items, using only a limited number k of samples. Szegedy showed that the scheme is almost optimal in terms of the total variance of the estimators among schemes of the same sample size k. In this report, we present two extensions of priority sampling. First, we present a sampling scheme for a vector weighted stream, which satisfies some near-optimality. As an application of the scheme, we present a priority sampling scheme to estimate the covariance of two kinds of weights associated to an item. Then we present a modified version of priority sampling that estimates an arbitrary subset sum of weights in the sliding window, a set of recent items of a fixed size. We analyze the proposed schemes experimentally.
机译:Duffield,Lund和Thorup提出的优先级采样估计了n个项的大型流中任意子集的权重,而权重来自有限数量的k个样本。塞格迪(Szegedy)显示,就样本数量相同的方法而言,该方法在估计量方差总和方面不是最优的。在此报告中,我们给出了优先抽样的两个扩展。首先,给出了矢量加权流的采样方法。这满足了一些次优性。作为此方法的一种应用,我们优先采样以估计与一项相关的两种权重的协方差。然后,我们给出一个修改后的优先抽样,该抽样可以估计一定数量的最近项目的滑动窗口内的任意加权部分和。对这些提出的方法进行了实验分析。由Duffield,Lund和Thorup提出的优先级抽样方案仅使用有限数量的k个样本即可估算n个加权项的大型加权流中任意子集的权重。在本报告中,我们提出了优先级采样的两个扩展:首先,我们提出了一种矢量加权流的采样方案,该方案满足了一些近似最优性。作为相同样本大小k的方案之间估计量的总方差之一。在该方案的应用中,我们提出了一种优先级抽样方案,以估计与某项相关的两种权重的协方差。然后,我们提出了一种优先级抽样的改进版本,它可以估算滑动窗口中权重的任意子集和,即一组固定大小的最新项目。我们通过实验分析了所提出的方案。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号