首页> 外文OA文献 >CRAWLER TERFOKUS BERBASIS ONTOLOGI DENGAN MENGGUNAKAN GAUSSIAN-BASED ADAPTIVE THRESHOLDING SETTING (GATS)
【2h】

CRAWLER TERFOKUS BERBASIS ONTOLOGI DENGAN MENGGUNAKAN GAUSSIAN-BASED ADAPTIVE THRESHOLDING SETTING (GATS)

机译:使用基于高斯的自适应阈值设置(GATS)的基于本体的聚焦爬虫

摘要

E-Government Development Index (EGDI) pada tahun 2016 menyatakan bahwa Indonesia memiliki peringkat terendah dibandingkan dengan sebagian besar negara-negara di Asia Tenggara. Salah satu penyebabnya adalah tidak terpeliharanya situs E-government kerena belum optimalnya integrasi data/informasi. Agar dapat mengatasi masalah tersebut maka diusulkan pendekatan agregasi secara otomatis dan integrasi data/informasi pada situs E-government. Pendekatan ini dapat diimplementasikan untuk meningkatkan kapasitas situs E-government, misalnya untuk memelihara konten secara otomatis dan benchmarking situs pemerintah. Data atau informasi yang digunakan diperoleh dari 10 situs pemerintah daerah di Jawa Tengah dengan teknik crawling terfokus berbasis ontology. Dari proses crawling akan dihitung tingkat relevansinya dengan ontology berdasarkan similarity, kemudian akan dilakukan pengecekan terhadap ambang batas kemiripan data atau informasi yang disebut dengan thresholding. Pada penelitian ini digunakan Gaussian-based adaptive thresholding setting (GATS) untuk mengolah data thresholding terhadap relevansi data crawling. Percobaan crawling pada 10 website ¬e-government pemerintahan daerah di Jawa Tengah berdasarkan pada 10 domain ontology yang ada, diperoleh 410 data relevan dari total 722 data crawling dimana diperoleh nilai total harvest-rate sebesar 56.79% dari 10 website e-government.
机译:2016年电子政务发展指数(EGDI)指出,与东南亚大多数国家/地区相比,印度尼西亚排名最低。原因之一是由于数据/信息集成尚未达到最佳状态,因此电子政务网站无法维护。为了克服这个问题,在电子政务网站上提出了一种自动聚合方法和数据/信息集成。可以实施此方法来提高电子政务网站的容量,例如自动维护内容并基准化政府网站。使用的数据或信息是使用基于本体的集中爬网技术从中爪哇的10个地方政府站点获得的。从爬网过程中,将基于本体基于相似度来计算相关性级别,然后将对数据或信息的相似度阈值(称为阈值)进行检查。在这项研究中,基于高斯的自适应阈值设置(GATS)用于处理阈值数据与数据爬网的相关性。在10个现有本体域的基础上,在中爪哇10个地方政府电子政务网站上进行了爬网实验,从总共722个爬网数据中获得了410个相关数据,从10个电子政务网站中获得的总收率为56.79%。

著录项

  • 作者

    TIAZ MUDA ISKANDAR;

  • 作者单位
  • 年度 2017
  • 总页数
  • 原文格式 PDF
  • 正文语种
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号