网页文本信息自动提取技术综述

张俊英; 胡侠; 卜佳俊

首页> 中文期刊> 《计算机应用研究》 >网页文本信息自动提取技术综述

网页文本信息自动提取技术综述

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

对Web网页文本信息自动提取技术提供了一个较为全面的综述.通过分析在这个领域常用到的三种信息提取模型和四类机器学习算法的发展,较为全面地阐述了当前主流的网页文本信息自动提取技术,对比了各种方法的应用范围,最后对于该领域当前的热点问题和发展趋势进行了展望.%This paper supplied a comprehensive survey of the text information extraction from Web page. By presenting and analyzing the development of three kinds of extraction modules and four types of the learning algorithms used in this area, it comprehensively surveyed the relative technologies of the text information extraction from Web page, and analyzed the application scenarios of different technologies. Finally, discussed the difficulties and the trend of the development of this area.

著录项

来源
《计算机应用研究》 |2009年第8期|2827-2831|共5页
作者
张俊英; 胡侠; 卜佳俊;
展开▼
作者单位

浙江大学;

计算机学院;

杭州;

310027;

杭州市科技信息研究院;

杭州;

310000;

浙江大学;

计算机学院;

杭州;

310027;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
信息提取; 机器学习; 网页;

相似文献

中文文献
外文文献
专利

1. 工程图文本信息的自动提取与建库技术研究 [J] . 李正敏 ,张树生 . 图学学报 . 2000,第002期
2. 基于网页结构特征的网页主要文本信息抽取策略 [J] . 火善栋 . 现代计算机（专业版） . 2008,第004期
3. 面向多张CAD图纸的文本信息自动提取与实现 [J] . 李锐 ,李文强 ,漆小华 . 工程设计学报 . 2021,第002期
4. Web页面文本信息的自动提取与挖掘 [J] . 朱培芳 ,王兰成 . 信息管理导刊 . 2002,第004期
5. 生物医学领域中的文本信息抽取技术与系统综述 [J] . 肖春 ,周建龙 . 计算机应用研究 . 2007,第009期
6. 工程图文本信息的自动提取与建库技术研究 [C] . 李正敏 ,张树生 . 第三届中国计算机图形学大会 . 2000
7. 基于网页列表的商品信息自动提取关键技术研究 [A] . 彭勇 . 2013

网页文本信息自动提取技术综述

摘要

著录项

相似文献

相关主题

期刊订阅