动态页面的web信息抽取方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

Web信息抽取是web领域的一项重要研究课题，研究范围涵盖信息检索、数据挖掘、人工智能等多门学科领域。Web信息抽取系统的智能性、准确性与适应性一直是该领域的研究重点与追求目标。当前大多数web信息抽取方法的处理对象都是某类网站的静态页面集，抽取内容相对比较简单，因此缺乏分析多种页面结构并抽取逻辑信息记录的机制。本文提出了一种基于动态页面集的信息抽取方法，抽取对象为实时生成的查询结果页面集，抽取内容为多个逻辑相关的信息项组成的信息记录。该方法使用XML配置文件对页面集的元数据与先验规则进行描述，并借用了文档图像处理中表格图像分析的基本方法与机制实现了对查询结果页面的解析与信息记录的智能提取。本文介绍了该方法的理论模型与系统实现，并对该方法的应用及实验结果进行了总结与评价。

著录项

作者
王晖;
展开▼
作者单位

南开大学;

展开▼
授予单位南开大学;
学科计算机应用技术
授予学位硕士
导师姓名许静;
年度 2006
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP393.092;TP311.13;
关键词
web信息抽取; 动态页面集; XML配置文件; 元数据; 表格图像处理;

相似文献

中文文献
外文文献
专利

1. 复杂语境下Web动态页面分层重构方法研究 [J] . 李深圳 ,严悍 ,戴楠 . 计算机与数字工程 . 2017,第011期
2. 远程教学系统中基于数据库的动态页面设计方法研究 [J] . 任庆丽 ,杨曙年 . 计算机与现代化 . 2002,第005期
3. Web信息抽取系统分类方法研究 [J] . 王宗良 ,高静 ,阿木古楞 . 内蒙古大学艺术学院学报 . 2012,第004期
4. Web信息抽取方法研究 [J] . 韩存鸽 ,燕敏 . 计算机系统应用 . 2009,第007期
5. Web信息抽取策略及其实现方法研究 [J] . 陈俊彬 . 科技情报开发与经济 . 2008,第023期
6. 动态页面采集关键技术研究 [C] . 尹涛 ,林祥 ,李翔 . 第六届中国信息和通信安全学术会议（CCICS'2009） . 2009
7. 支持动态页面的快速URL提取方法研究 [A] . 张洪庆 . 2013

动态页面的web信息抽取方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅