首页> 外文期刊>電子情報通信学会技術研究報告 >Web Tracking Site Detection and Blacklist Generation Based on Temporal Link Analysis
【24h】

Web Tracking Site Detection and Blacklist Generation Based on Temporal Link Analysis

机译:基于时间链接分析的Web跟踪站点检测与黑名单生成

获取原文
获取原文并翻译 | 示例
       

摘要

Web tracking sites or Web bugs are potential but serious threats to users' privacy during Web browsing. Web sites and their associated advertising sites surreptitiously gather the profiles of visitors and possibly abuse or improperly expose them, even if visitors do not provide their profiles consciously. In order to prevent such sites in a corporate network, most companies employ niters that rely on blacklists, however, these lists are insufficient. In this paper, we propose Web tracking sites detection and blacklist generation based on temporal link analysis. Our proposal analyzes traffic at the network gateway so that it can monitor all tracking sites in the administrative network. The proposed algorithm constructs a graph between sites and their visited time in order to characterize each site. Then, the system classifies suspicious sites using machine-learning algorithms. We confirm that 62-73% of detected tracking sites are listed on public blacklists, and 96% of unlisted sites are unknown or suspicious tracking sites.%Webトラッキングサイト・Webバグとは,Webページに小さな画像を埋め込むことによって閲覧者のアクセス先に関する情報を収集する方法である.企業組織では,従業員のWebアクセスによって内部情報が流出する危険性があるため問題/となっている.これまで,HTMLに含まれる画像のサイズやURLを解析することによって,Webバグを検知する方式が提案されてきた.しかし,近年のWebの発展に伴い,従来方式による検知が困難なサイトが増加している.本稿では,タイミングを考慮したリンク解析によるWebトラッキングサイト検知方式を提案する.提案方式は,LAN内の通信におけるユーザのWebサイト閲覧を解析して,タイミングを考慮したページ間のリンク関係を表すグラフを作成する.そして機械学習を利用することによってトラッキングサイトを検知する.企業LANにおける3ケ月の通信を用いた評価の結果,提案方式にトラッキングサイトとして検知されたサイトの62-73%が既存のブラックリストに登録されており,残りの96%が登録されていない未知のサイトと疑わしいサイトであることを確認した.
机译:Web跟踪站点或Web错误是潜在的,但在Web浏览期间会严重威胁用户的隐私。网站及其相关的广告网站会秘密收集访问者的个人资料,即使访问者不自觉地提供其个人资料,也可能滥用或不当暴露他们。为了防止在公司网络中出现此类站点,大多数公司雇用依赖于黑名单的niters,但是这些列表是不够的。在本文中,我们提出了基于时间链接分析的Web跟踪站点检测和黑名单生成。我们的建议分析网络网关处的流量,以便它可以监视管理网络中的所有跟踪站点。所提出的算法在站点及其访问时间之间构造了一个图,以表征每个站点。然后,系统使用机器学习算法对可疑站点进行分类。我们确认已将62-73%的检测到的跟踪站点列在公共黑名单中,而96%的未列出站点是未知或可疑的跟踪站点。%企业组织では,従业员のWebアクセスによって内部情报が发生する危険性があるため问题/となっている。これまで,HTMLに含まれる画像のサイズ。やURLを解析することによって,Webバグを検知する方式が进行されてきた。しかし,近年のWebの発展に伴い,従来方式による検知が困难なサイトが増加している。本稿では,タイミングを考虑方式方式は,LAN内部の通信におけるーーののWebサイト覧を覧を解析して,タイミングを考虑グをージ间のリンク关系を表すグラフを作成する。企业LANにおける3ケ月の通信を用いた评価の结果,转移方式にトラッキングサイトとして検知されたサイトの62-73%が既存のブラックリストに登录にり,残りの96%が登录されていない未知のサイトと疑わしいサイトであることを确认した。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号