基于XML的WEB信息自动抽取方法的研究

宋洁; 张娜; 刘艳柳; 顾军华

首页> 中文期刊> 《河北工业大学学报》 >基于XML的WEB信息自动抽取方法的研究

基于XML的WEB信息自动抽取方法的研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

互联网的快速发展以及Web数据的日益庞大,使用户从Web中获取有用信息变得日益困难,如何快速有效地从Web中准确抽取信息已经成为亟待解决的问题,Web信息抽取技术应运而生.提出了一种新的基于XML的WEB信息自动抽取方法,采用数据转换算法将HTML文档标准化,通过学习样本实例的XPATH表达式,形成抽取规则库,并利用规则库对其它同类页面实现信息的自动抽取.实验结果表明,该方法具有较高的查全率和查准率,且抽取结果具有自描述性,方便于建立各个领域的数据抽取系统.

著录项

来源
《河北工业大学学报》 |2010年第5期|73-77|共5页
作者
宋洁; 张娜; 刘艳柳; 顾军华;
展开▼
作者单位

河北工业大学,计算机科学与软件学院,天津,300401;

河北工业大学,计算机科学与软件学院,天津,300401;

河北工业大学,计算机科学与软件学院,天津,300401;

河北工业大学,计算机科学与软件学院,天津,300401;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
XML; XPATH学习; XSL; 信息抽取; DOM树;

相似文献

中文文献
外文文献
专利

1. 基于xml的Deep Web信息自动抽取技术的研究 [J] . 彭媛媛 ,许建潮 . 科技信息 . 2009,第033期
2. 模板化的Web列表页面信息自动抽取方法的研究* [J] . 王琛 . 现代计算机（普及版） . 2013,第008期
3. 基于XML技术的WEB信息收集方法研究 [J] . 董怀冰 . 电子技术与软件工程 . 2015,第003期
4. 基于XML和ASP的Web信息集成方法研究 [J] . 缪刘俊 . 南通大学学报（自然科学版） . 2003,第001期
5. 一种基于XML的Web信息数据库的构建方法 [J] . 杨春蓉 . 无线互联科技 . 2012,第010期
6. 基于Web的农业信息自动抽取方法研究 [C] . 王文生 ,谢能付 . 全国农业信息分析理论与方法学术研讨会 . 2009
7. 基于视觉信息的Deep Web信息自动抽取技术的研究 [A] . 谈凤真 . 2013

基于XML的WEB信息自动抽取方法的研究

摘要

著录项

相似文献

相关主题

期刊订阅