首页> 外文会议>IEEE International Conference on Computational Intelligence and Cybernetics >Web crawler utilization for resource search on Indonesian anti-plagiarism detection: Pemanfaatan web crawler untuk pencarian referensi pada deteksi anti-plagiarisme dokumen Bahasa Indonesia
【24h】

Web crawler utilization for resource search on Indonesian anti-plagiarism detection: Pemanfaatan web crawler untuk pencarian referensi pada deteksi anti-plagiarisme dokumen Bahasa Indonesia

机译:印度尼西亚反抄袭检测的​​资源搜索网络履带利用率:利用Web爬行者参考搜索印度尼西亚文献的防抄袭检测

获取原文

摘要

Matching one document with other documents is one of anti-plagiarism tasks. Matching can be performed both intra and extra-corpal. This paper will discuss extra-corpal matching utilize the web crawlers as reference search. The role of web-crawler described in extra-corpal anti-plagiarism architecture. Matching of plagiarism indication will use Modified Histogram Intersection based on N-Gram of term. Similarity value utilizing modified normalized histogram intersection that devoted to matching extra corpal. Based on our experiment the best accuracy is given in 0.4 and 0.5 threshold value thats give 94% accuracy.
机译:将一个文件与其他文件匹配是反抄袭任务之一。可以进行匹配,可以进行帧内和超尸体。本文将讨论特定群体匹配,利用Web爬网作为参考搜索。网上履带式中描述在尸体反抄袭架构中的作用。抄袭指示的匹配将基于N-GRAM的术语使用改进的直方图交叉点。使用修改的归一化直方图交叉口的相似性值,该交叉点致力于匹配额外的CORPAL。基于我们的实验,最优质的精度在0.4和0.5阈值下给出,即提供94%的精度。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号