...
首页> 外文期刊>電子情報通信学会論文誌 >特定言語で記述されたWebページの選択的収集手法とその評価
【24h】

特定言語で記述されたWebページの選択的収集手法とその評価

机译:以特定语言编写的网页的选择性收集方法及其评估

获取原文
获取原文并翻译 | 示例

摘要

Web情報の文化的・社会的価値に対する認識の高まりとともに,将来に向けた長期保存や社会事象rnの分析を目的としたWebアーカイビングプロジェクトが各国で進められている.しかしながら,Webには明確rnな国境がなく,特定の国家や文化圏に関するWeb情報のみを網羅的に収集することは困難である.本論文では,rn大規模なクローリングによりWeb情報のサブセットを収集し,そのグラフ構造を記述言語の観点から分析するrnことで,Webサーバごとの言語属性を利用するクローリング指針を導き出す.更に,その指針に基づいて,Webrnページ及びサーバの言語属性を判定しつつ特定言語のページを選択的に収集する手法を提案し,シミュレーショrnンにより収集効率と実行効率における有効性を示す.
机译:随着人们对Web信息的文化和社会价值的认识日益提高,每个国家都在推动旨在未来长期保存和分析社会现象的Web归档项目。但是,Web上没有明确的边界,仅全面地收集有关特定国家或文化地区的Web信息很困难。在本文中,我们通过大规模爬网来收集Web信息的子集,并从描述语言的角度分析图结构,从而得出使用每个Web服务器的语言属性的爬网准则。此外,基于该准则,我们提出了一种在判断服务器的语言属性的同时有选择地收集Webrn页面和特定语言的页面的方法,并通过仿真显示了收集效率和执行效率的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号