基于DOM和网页模板的Web信息抽取

王丽; 唐建雄

首页> 中文期刊> 《电脑知识与技术》 >基于DOM和网页模板的Web信息抽取

基于DOM和网页模板的Web信息抽取

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

文章提出了一种基于DOM(文档结构模型)和网页模板的Web信息提取方法.参照DOM的定义,通过构造HTML解析树来描述网页结构.在抽取网页之前,先通过归纳网页模板来过滤网页中的噪音信息.然后,使用基于相对路径的抽取规则来进行信息抽取.最后,本文给出了归纳网页模板和抽取网页信息的实验结果.实验结果表明本文提出的归纳网页模板方法和信息抽取方法是正确的和高效的.

著录项

来源
《电脑知识与技术》 |2007年第18期|1617-1619|共3页
作者
王丽; 唐建雄;
展开▼
作者单位

武汉理工大学;

计算机科学与技术学院;

湖北;

武汉;

430063;

武汉理工大学;

计算机科学与技术学院;

湖北;

武汉;

430063;

展开▼
原文格式 PDF
正文语种 chi
中图分类程序设计、软件工程;
关键词
信息抽取; 文档结构模型; 网页模板; 抽取规则; 相对路径;

相似文献

中文文献
外文文献
专利

1. 基于DOM和网页模板的Web信息抽取 [J] . 王丽 ,唐建雄 . 电脑知识与技术 . 2007,第018期
2. 支持DOM模板可视化配置的网页抽取方法 [J] . 李健 ,马延周 . 现代计算机（专业版） . 2018,第010期
3. 基于单DOM树特征预分类的自适应Web信息抽取方法 [J] . 彭艳兵 ,谢馨庭 . 电子设计工程 . 2017,第019期
4. 基于XML和DOM技术的Web信息抽取模型 [J] . 李文 ,郑邦习 ,邓武 . 大连交通大学学报 . 2013,第003期
5. 基于时间频率加权DOM的Web信息抽取方法 [J] . 马瑞民 ,钱浩 . 长江大学学报（自然版）理工卷 . 2011,第001期
6. 基于简化Dom Tree的网页数据提取 [C] . Shi Chenfang ,史辰方 ,Wang Peng . 2012云计算与信息技术应用学术会议 . 2012
7. 基于DOM和网页模板的信息抽取 [A] . 苏文健 . 2006

基于DOM和网页模板的Web信息抽取

摘要

著录项

相似文献

相关主题

期刊订阅