首页> 外文期刊>Teknika >Perbandingan Metode Web Scraping Menggunakan CSS Selector dan Xpath Selector
【24h】

Perbandingan Metode Web Scraping Menggunakan CSS Selector dan Xpath Selector

机译:CSS选择器和Xpath选择器进行Web爬网方法的比较

获取原文
           

摘要

Pemanfaatan data atau berita yang tersebar di internet untuk meningkatkan peluang keberhasilan dalam sebuah usaha melalui analisa trend pasar adalah hal yang sangat umum pada saat ini. Penjelajahan Web (Crawl) dan ekstraksi data dari web (Scraping) menjadi salah satu hal yang penting, agar tidak terjadi data yang kurang sempurna, dan data yang diterima adalah data yang paling baru. CSS Selector dan Xpath merupakan salah satu metode yang umum digunakan dalam melakukan proses crawling. Terdapat perbedaan dari jumlah data yang terambil, besar file output dan waktu pemrosesan dari kedua metode tersebut, dimana Xpath memiliki keunggulan pada jumlah data yang terambil dan waktu pemrosesnya yang berakibat pada ukuran file output yang lebih besar. Sedangkan untuk penggunaan memori pada kedua metode pada proses crawling tidak memiliki perbedaan yang signifikan.
机译:如今,通过分析市场趋势来利用互联网上传播的数据或新闻来增加业务成功的机会非常普遍。为了避免数据不完整,Web浏览(爬网)和从Web上提取数据(抓取)是重要的事情,并且接收到的数据是最新数据。 CSS Selector和Xpath是爬网中常用的方法。两种方法检索到的数据量,输出文件的大小和处理时间有所不同,其中Xpath具有检索到的数据量和处理时间的优势,这会导致较大的输出文件大小。同时,在爬网过程中两种方法中对内存的使用没有显着差异。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号