【24h】

Semantics-based Extraction of Webpage Main Text

机译:基于语义的网页正文提取

获取原文
获取原文并翻译 | 示例

摘要

Extraction of webpage main text is one of the most efficient methods to improve search engine.In the traditional method,the extraction of the webpage main text use the similarity of DOM sub-tree as a end condition for the DOM tree traversing,while its speed is unsatisfactory on such a complex webpage structure.Thus,to raise the traverse speed and accuracy of DOM sub-tree effectively,we propose a method which is Semantics-based Extraction of Webpage Main text.
机译:网页主体文本的提取是改进搜索引擎的最有效方法之一。在传统方法中,网页主体文本的提取以DOM子树的相似性作为遍历DOM树的最终条件,而其速度却很快。因此,为有效提高DOM子树的遍历速度和准确性,提出了一种基于语义的网页正文提取方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号