首页> 外文会议>WISE 2014 >Automatically Annotating Structured Web Data Using a SVM-Based Multiclass Classifier
【24h】

Automatically Annotating Structured Web Data Using a SVM-Based Multiclass Classifier

机译:使用基于SVM的多字符分类器自动注释结构化Web数据

获取原文

摘要

In this paper, we propose a new learning approach to Web data annotation, where a support vector machine-based multiclass classifier is trained to assign labels to data items. For data record extraction, a data section re-segmentation algorithm based on visual and content features is introduced to improve the performance of Web data record extraction. We have implemented the proposed approach and tested it with a large set of Web query result pages in different domains. Our experimental results show that our proposed approach is highly effective and efficient.
机译:在本文中,我们向Web数据注释提出了一种新的学习方法,其中训练了基于支持向量机的多字符类分类,以将标签分配给数据项。对于数据记录提取,引入了基于视觉和内容特征的数据部分重新分割算法,以提高Web数据记录提取的性能。我们已经实现了所提出的方法,并在不同域中使用大量的Web查询结果页面进行测试。我们的实验结果表明,我们的建议方法非常有效和高效。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号