面向农业信息的主题爬虫的研究与设计

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着互联网技术的发展，网络信息资源的急剧增长，网民人数越来越多，网络在人们的日常生活和工作的作用越来越大，因此人们越来越多地关注如何快速有效地从海量的网络信息中，提取出潜在的、有价值的信息，使之有效地在工作和生活中发挥作用，所以专业领域主题Web信息的有效获取成为各行业有效利用网络信息资源的基础。
　　面向农业信息的主题爬虫是专注于在海量的网络信息中有效地识别与农业相关的Web信息资源，并进行获取和及时更新的系统。它可以实现对图片下载，对爬取网页的编码进行统一，对抓取的与农业相关的资源进行过滤，识别出符合需求的内容网页。
　　本文首先对农业智能信息化业务平台进行了初步的描述，重点介绍了在这一平台上搭建的面向农业的主题爬虫的特点。在介绍主题爬虫时，本文对爬虫的架构、原理、组成、工作流程做了阐述。特别是针对农业业务平台对资源的特殊要求，介绍了爬虫在采集信息时，做了怎样的处理。
　　本文重点开发了面向农业信息的主题爬虫。从nutch开源搜索引擎入手，进行二次开发，在nutch工作流程的基础上，加入初选模块，详细说明了该系统开发过程和方法，并对实现结果，有了清晰的展现，证明了面向农业信息的主题爬虫的设计方案和实现方法所具有的可行性和实用性。

著录项

作者
张宁;
展开▼
作者单位

北京邮电大学;

展开▼
授予单位北京邮电大学;
学科软件工程
授予学位硕士
导师姓名郭文明;
年度 2010
页码
总页数
原文格式 PDF
正文语种中文
中图分类检索机;
关键词
农业信息; 主题爬虫; 数据采集; Nutch开源; 中文分词; 搜索引擎;

相似文献

中文文献
外文文献
专利

1. 一种面向农业信息主题网络爬虫的设计 [J] . 汪斌 ,张云伟 ,刘健 . 安徽农业科学 . 2009,第020期
2. 面向专用信息获取的用户定制主题网络爬虫技术探究 [J] . 蒲文莹 . 电脑编程技巧与维护 . 2019,第001期
3. 面向专用信息获取的用户定制主题网络爬虫技术研究 [J] . 薛丽敏 ,吴琦 ,李骏 . 信息网络安全 . 2017,第002期
4. 面向主题搜索的网络爬虫信息采集策略研究 [J] . 万文兵 . 软件导刊 . 2015,第011期
5. 面向主题搜索的网络爬虫信息采集策略研究 [J] . 万文兵 . 软件导刊 . 2015,第011期
6. 基于多语种农业叙词表AGROVOC的主题爬虫策略 [C] . 康丽 ,杨仁刚 ,夏崇镨 . 第一届国际计算机及计算技术在农业中的应用研讨会暨第一届中国农村信息化发展论坛 . 2007
7. 基于Best-First和PageRank算法的农业信息主题爬虫的研究与设计 [A] . 逄锦秀 . 2019

面向农业信息的主题爬虫的研究与设计

目录

摘要

著录项

相似文献

相关主题

期刊订阅