首页> 外文期刊>Computer Science and Application >基于模板和SVM协同工作的网页去噪方法
【24h】

基于模板和SVM协同工作的网页去噪方法

机译:基于模板和SVM协同工作的网页去噪方法

获取原文
       

摘要

本文提出一种基于模板和支持向量机(SVM)协同工作的网页去噪方法。该方法将网页噪声分为公共噪声和个性化噪声两类。首先从网页集合中建立模板库,利用模板去除网页公共噪声。对于剩下的个性化噪声,先计算块级标签特征,利用这些特征训练SVM模型,最后用训练好的SVM模型将块级标签分为噪声和正文两类,达到去噪目的。该方法能够有效去除主题型网页中的版权、导航、广告等噪声信息。与单纯使用SVM进行网页去噪相比,查准率和查全率上均有提升。.
机译:本文提出一种基于模板和支持向量机(SVM)协同工作的网页去噪方法。该方法将网页噪声分为公共噪声和个性化噪声两类。首先从网页集合中建立模板库,利用模板去除网页公共噪声。对于剩下的个性化噪声,先计算块级标签特征,利用这些特征训练SVM模型,最后用训练好的SVM模型将块级标签分为噪声和正文两类,达到去噪目的。该方法能够有效去除主题型网页中的版权、导航、广告等噪声信息。与单纯使用SVM进行网页去噪相比,查准率和查全率上均有提升。.

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号