首页> 中文期刊> 《计算机工程》 >基于网站拓扑的网页内容精化算法

基于网站拓扑的网页内容精化算法

         

摘要

通过对网页中无关信息分布特点和模式的分析,提出了一种新颖的网页内容精化算法--基于网站拓扑信息的网页无关内容识别与剔除算法.该算法在对网页内容进行分区后,认定与父节点网页具有相同内容的分区为该网页无关信息内容分区并将其删除.测试结果表明,该算法具有较高的识别率及精度.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号