首页> 中文会议>第二十四届全国计算机信息管理学术研讨会 >基于文本模型的通用Web信息采集系统设计与实现

基于文本模型的通用Web信息采集系统设计与实现

页面导航

摘要
著录项
相似文献
相关主题

摘要

随着Web上信息爆炸性增长，各项基于Web的服务也逐渐繁荣起来。作为这些信息服务的基础和重要组成部分，Web信息采集正应用于搜索引擎、站点结构分析、页面有效性分析、Web图进化、用户兴趣挖掘以及个性化信息获取等多种应用和研究中。本文主要分析和介绍一种通过建立网页资源库、结合Spider技术、内容分析技术，引入用户数据项和替换抽取指令编辑器等，提供和定制可视化、通用性较强的Web信息采集系统的设计实现思路，该系统能自动跟踪相关网站或网页，对其文本模型信息进行比较分析、抽取和规整入库等。

著录项

来源
《第二十四届全国计算机信息管理学术研讨会》|2010年|250-256|共7页
会议地点南宁
作者
姜丽;
展开▼
作者单位

中国科学技术情报学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类 TP274.2;TP393.09;
关键词
文本模型; 信息采集; Web服务;

相似文献

中文文献
外文文献
专利

1. 基于XML的Web信息采集系统设计与实现 [J] . 王磊 . 齐齐哈尔大学学报（自然科学版） . 2017,第002期
2. 基于移动WEB的小规模快速信息采集系统设计与实现 [J] . 朱云雷 . 电力学报 . 2013,第002期
3. 基于Web的定向医药信息采集系统设计与实现 [J] . 邹元平 ,邢珂 ,林宇 . 医学信息学杂志 . 2012,第005期
4. 基于Web的智能信息采集及处理系统设计与实现 [J] . 张帆 ,李琳娜 ,杨炳儒 . 计算机工程 . 2007,第018期
5. 基于Android和Web的通用航空业务管理系统设计与实现 [J] . 赵富强 ,罗伍周 ,朱小波 . 现代计算机（专业版） . 2019,第032期
6. 面向Web服务的一种通用基于属性角色访问控制模型 [C] . 朱一群 ,李建华 ,张全海 . 2007中国计算机大会 . 2007
7. 基于Java Web的信息采集及调试管理系统设计与实现 [A] . 蒲光杰 . 2020

基于文本模型的通用Web信息采集系统设计与实现

摘要

著录项

相似文献

相关主题

期刊订阅