首页> 外文期刊>電子情報通信学会技術研究報告 >P2Pファイル共有システムにおけるクエリトレンドパターンの分析
【24h】

P2Pファイル共有システムにおけるクエリトレンドパターンの分析

机译:P2P文件共享系统中的查询趋势模式分析

获取原文
获取原文并翻译 | 示例
       

摘要

In P2P file sharing systems, caching of contents is one of practical methods to improve the search efficiency and the load balancing. Since the resources (e.g., disk spaces) for caching are limited, the contents to be cached may vary according to the cache replacement algorithm. However, typical cache replacement algorithms do not consider the time-dependent trends of query keywords. Therefore, the problem that many of caches that might not be effectively used remains comes to happen. Therefore, the cache replacement algorithms is necessary. In this paper, we analyze the time-dependent trends of query keywords in P2P file sharing system towards a new cache replacement method which takes query trends into consideration. First, we collect keyword (filename) queries by crawling the P2P file sharing system. We then analyze similarities of time-dependent trends of queries by using Discrete Fourier Transform. We then categorize trend pattern by applying the hierarchical clustering. As a result, we show that time-dependent trend patterns of query can be categorized into four types.%P2Pファイル共有システムでは,負荷分散や検索効率の向上を目的としたコンテンツのキャッシュ(複製)が行われている.ピアのキャッシュ容量は有限であるため,時刻やアクセス頻度によってキャッシュ内容の更新が行われている.しかし,コンテンツへの要求の時間的傾向(トレンド)を考慮したキャッシュ内容の更新は行われていない.そのため、有効に活用されることのないキャッシュが残存するという問題が起こることとなる.そこで、トレンドパターンを考慮した,効率的な新しいキャッシュ置き換えアルゴリズムを考案する必要がある.本稿では,トレンドパターンを考慮した新しいキャッシュ置き換えアルゴリズムを提案するために必要となる,P2Pファイル共有システムにおけるトレンド分析を行う.そのためにまず,P2Pファイル共有システムをクロールし,P2Pファイル共有システム上を流れる検索クエリの計測を行う.さらに,計測した個々のクエリの時系列推移データに対して離散フーリエ変換(DFT)を適用することにより,個々のクエリの時系列推移パターン間の非類似度を導出し,階層的クラスタリングによりトレンドパターンの分類を行った.その結果,P2Pファイル共有システムにおけるトレンドパターンは大きく4種類に分類できることが分かった.
机译:在P2P文件共享系统中,内容缓存是提高搜索效率和负载平衡的一种实用方法。由于用于缓存的资源(例如,磁盘空间)是有限的,因此要缓存的内容可以根据缓存替换算法而变化。但是,典型的缓存替换算法不考虑查询关键字的时间依赖性趋势。因此,仍然存在许多可能未被有效使用的缓存的问题。因此,缓存替换算法是必要的。在本文中,我们分析了P2P文件共享系统中查询关键词随时间的变化趋势,朝着一种新的考虑查询趋势的缓存替换方法进行了研究。首先,我们通过抓取P2P文件共享系统来收集关键字(文件名)查询。然后,我们通过使用离散傅立叶变换来分析时间依赖性查询趋势的相似性。然后,我们通过应用层次聚类对趋势模式进行分类。结果,我们显示出查询的时间相关趋势模式可以分为四种类型。しかしアのキャッテ容量シュ有限であるため,时刻やアクセス频度によってキャッシュ内容の更新が行われている。そこでい。そのため,有效に活用されることのないキャッシュが残存するという问题が起こるここることトレンをンを考虑した,效率的な新しいキャッシュ置き换えアルゴリズムを考案する必要がある。本稿では,トレンド2ーンを考虑した新しいキャッシュ放置き换えアルゴリズムを实施するために必要となる,P2Pファイル共有システムにおけるトレンド分析ド行う。を行う。その结果,P2Pファイル共有システムにおけるトレンドパターはンは大きく4种に分类できることが分かった。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号