首页> 外文OA文献 >Web Information-Extraction Based on Vision Block and Multi-Features
【2h】

Web Information-Extraction Based on Vision Block and Multi-Features

机译:基于视觉块和多功能的Web信息提取

摘要

随着信息社会的快速发展,web数据已经发展成为一种巨大的信息资源。Web信息抽取作为一种从web数据中抽取主题信息的研究内容,是数据分类、自然语言处理等研究领域的基础。因此,如何准确快速的从海量的web数据中抽取关注的信息变得越来越重要。本文对web信息抽取的方法进行了研究,并针对研究过程中遇到的问题,提出相应的解决方法。本文的主要研究内容如下: (1)对已存在的各种web信息抽取算法做出了详细的研究比较。 (2)本文的主要目的是对具有主题信息的主题型网页进行正文抽取,而对于链接型网页不予处理。因此要先判断输入网址的网页类型。本文对两种网页进行了详细的比较,提炼出五个明显的特征,并提出一种...
机译:随着信息社会的快速发展,web数据已经发展成为一种巨大的信息资源。Web信息抽取作为一种从web数据中抽取主题信息的研究内容,是数据分类、自然语言处理等研究领域的基础。因此,如何准确快速的从海量的web数据中抽取关注的信息变得越来越重要。本文对web信息抽取的方法进行了研究,并针对研究过程中遇到的问题,提出相应的解决方法。本文的主要研究内容如下: (1)对已存在的各种web信息抽取算法做出了详细的研究比较。 (2)本文的主要目的是对具有主题信息的主题型网页进行正文抽取,而对于链接型网页不予处理。因此要先判断输入网址的网页类型。本文对两种网页进行了详细的比较,提炼出五个明显的特征,并提出一种...

著录项

  • 作者

    郑艳红;

  • 作者单位
  • 年度 2012
  • 总页数
  • 原文格式 PDF
  • 正文语种 zh_CN
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号