...
首页> 外文期刊>電子情報通信学会技術研究報告. コンピュテ-ション. Theoretical Foundations of Computing >集合間類似度を用いたストリームデータのtop-k類似検索に対する高速な厳密解アルゴリズム
【24h】

集合間類似度を用いたストリームデータのtop-k類似検索に対する高速な厳密解アルゴリズム

机译:使用帧间间相似性的流数据对流数据的高速精确解决算法

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

ストリームデータの類似検索は,正常/異常検出や情報推薦の基盤となる技術として注目されている.本研究では,データストリームの直近の要素集合をクエリとし,データベースから最も類似するk個のデータを検索する問題を取り扱う.本問題に対してはこれまで,現在の時刻で上位k位に入る可能性があるデータを過去に計算した類似度から決定し,それらに対してのみ類似度を計算する枝刈りによる厳密解アルゴリズムが提案されている.これに対して本研究では,既存手法より大幅に実行時間を短縮する高速な厳密解アルゴリズムを提案する.提案手法は,頻度を考慮した転置インデックスを用いて現在時刻と次の時刻で類似度が変わるデータを効率的に特定し,それらに対してのみ,類似度を更新することで類似度の計算回数を減らす.さらに,類似度もO(1)で更新することで処理時間を短縮する.
机译:类似搜索流数据是吸引注意力作为正常/异常检测和信息推荐的基础。在本研究中,我们处理问题以查询最新元素集的数据流集,并检索与数据库中最相似的k个数据。已经从过去计算的相似性的相似性确定了该问题,该相似性已经确定为在当前时间的顶部k位置,并且提出了通过修剪仅通过修剪来计算相似性的严格解决方案算法。另一方面,在本研究中,我们提出了一种高速精确的解决方案算法,可显着减少了比现有方法的执行时间。该方法使用转换索引,该索引采用频率,以有效地识别下次和下次在下次更改相似性的数据,并通过仅更新其缩小的相似性来更新相似度。此外,相似度也通过更新O(1)来减少处理时间。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号