首页> 外国专利> System and method for smoothing hierarchical data using isotonic regression

System and method for smoothing hierarchical data using isotonic regression

机译:使用等渗回归平滑分层数据的系统和方法

摘要

An improved system and method is provided for detecting a web page template. A web page template detector may be provided for performing page-level template detection on a web page. In general, the web page template classifier may be trained using automatically generated training data, and then the web page template classifier may be applied to web pages to identify web page templates. A web page template may be detected by classifying segments of a web page as template structures, by assigning classification scores to the segments of the web page classified as template structures, and then by smoothing the classification scores assigned to the segments of the web page. Generalized isotonic regression may be applied for smoothing scores associated with the nodes of a hierarchy by minimizing an optimization function using dynamic programming.
机译:提供了一种用于检测网页模板的改进的系统和方法。可以提供网页模板检测器以用于在网页上执行页面级模板检测。通常,可以使用自动生成的训练数据来训练网页模板分类器,然后可以将网页模板分类器应用于网页以识别网页模板。可以通过以下步骤来检测网页模板:将网页的各段分类为模板结构,通过将分类分数分配给被分类为模板结构的网页的各段,然后通过平滑分配给该网页的各段的分类分数。通过使用动态编程使优化函数最小化,可以将广义等渗回归应用于与层次结构的节点关联的分数平滑。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号