首页> 外文期刊>International Journal of Scientific & Technology Research >EXTRACTION OF WEB BLOCKS FROM WEB PAGES AND ANALYSIS OF EXTRACTION ALGORITHMS
【24h】

EXTRACTION OF WEB BLOCKS FROM WEB PAGES AND ANALYSIS OF EXTRACTION ALGORITHMS

机译:从网页中提取Web块和提取算法分析

获取原文
           

摘要

Abstract: Web page can be divided in various blocks called as fragments. A fragment is a portion of a web page which has a distinct theme or functionality and is distinguishable from the other parts of the page.Dividing web pages into fragments has provided significant benefits. Good methods are needed for dividing web pages into fragments. Manual fragmentation of web pages is expensive, error prone, and un-scalable. Due to these problems, extraction of web fragments using Content extractor algorithm and DeSeA algorithm have been widely used. The proposed work has following features: 1) Detect fragment using content extractor algorithm. 2) Extraction of fragment detected in step (1). 3) Detect fragment using DeSeA algorithm. 4) Extraction of fragment detected in step (3). 5) Analyze results of extracted fragment using above algorithms.
机译:摘要:网页可以分为多个片段,称为片段。片段是网页的一部分,它具有不同的主题或功能,并且可以与页面的其他部分区分开。将网页分为片段可以提供很多好处。需要使用良好的方法将网页分成多个片段。网页的手动分段非常昂贵,容易出错且无法扩展。由于这些问题,使用内容提取器算法和DeSeA算法提取Web片段已被广泛使用。提出的工作具有以下特点:1)利用内容提取算法检测片段。 2)提取在步骤(1)中检测到的片段。 3)使用DeSeA算法检测片段。 4)提取在步骤(3)中检测到的片段。 5)使用以上算法分析提取的片段的结果。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号