首页> 外文会议>International Conference on Digital Information Processing and Communications >Automatic data extraction of websites using data path matching and alignment
【24h】

Automatic data extraction of websites using data path matching and alignment

机译:使用数据路径匹配和对齐方式自动数据提取网站

获取原文

摘要

Since most of web pages contain their main information in data records, extracting data records enables one to obtain and integrate data from diverse sources of Internet. Therefore, data extraction of web pages has been a popular research issue in the last decade. The paper aims to automatically extract data records from web pages and identify items from those extracted records. The proposed approach utilizes Data Path Matching to effectively extract data records and Data Path Code Alignment to efficiently identify data items. Experimental results reveal that the method can extract data effectively.
机译:由于大多数网页都包含数据记录中的主要信息,因此提取数据记录使得能够从不同的Internet来源获取和集成数据。因此,网页的数据提取是过去十年中的流行研究问题。本文旨在自动从网页中提取数据记录并从提取的记录中识别项目。所提出的方法利用数据路径匹配,以有效地提取数据记录和数据路径代码对齐,以有效地识别数据项。实验结果表明,该方法可以有效提取数据。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号