首页> 外文会议>International Conference on Practical Applications of Agents and Multiagent Systems >Mining Web Pages Using Features of Rendering HTML Elements in the Web Browser
【24h】

Mining Web Pages Using Features of Rendering HTML Elements in the Web Browser

机译:使用Web浏览器中的HTML元素的功能挖掘网页

获取原文

摘要

The Web is the largest repository of useful information available for human users, but it is usual that Web Pages do not provide an API to get access to its information automatically. In order to solve this problem, Information Extractors are developed. We present a new methodology to induce Information Extractors from the Web. It is based on rendering HTML elements in the Web browser. The methodology uses a KDD process to mining a dataset with features of the elements in the Web page. An experimentation over 10 web sites has been made and the results show the effectiveness of the methodology.
机译:Web是人类用户可用的最大信息存储库,但通常的网页不提供API以自动访问其信息。为了解决这个问题,开发了信息提取器。我们提出了一种新的方法来引导来自网络的信息提取器。它基于呈现Web浏览器中的HTML元素。该方法使用KDD进程来挖掘数据集,其中包含网页中元素的功能。已经进行了超过10个网站的实验,结果表明了方法的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号