限定主题的智能网络爬行器研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

本文讨论限定主题的网络爬行问题.本文中给出了一个一般的网络爬行器的结构,介绍并实现了两种类型的网络爬行策略:基于内容的限定主题的爬行和基于网络拓扑结构的限定主题的爬行.本文中提出的方法综合使用了页面内容信息与链接文本来指导网络爬行器的爬行,实验结果显示这是一种寻找主题相关页面的很有效的方法.本文中提出了一种新颖的评价方法.我们首先采集了大量的页面并建立了一个数据集,然后将这个数据集中的页面用一个SVM分类器分成三个不同的领域(网球、田径、其它),我们把这些分类结果看成是正确答案.然后,我们在这个数据集上用不同的爬行算法来运行虚拟的爬行来评价这些爬行算法.

著录项

作者
张军;
展开▼
作者单位

哈尔滨工业大学;

展开▼
授予单位哈尔滨工业大学;
学科计算机科学与技术
授予学位硕士
导师姓名赵铁军;
年度 2005
页码
总页数
原文格式 PDF
正文语种中文
中图分类检索机;
关键词
网络爬行器; 网络信息处理; 互联网; 限定主题; 爬行算法;

相似文献

中文文献
外文文献
专利

1. 基于伪爬行器的主题式元搜索引擎研究与设计 [J] . 马奕平 ,庄毅 ,叶延风 . 计算机工程 . 2008,第022期
2. 网络舆情智能监测系统的主题监测功能研究——以高校BBS舆情监测为例 [J] . 周莉娜 . 科技情报开发与经济 . 2010,第029期
3. 面向主题网络爬行的智能隧道穿越算法研究 [J] . 黄莉 ,王成良 ,杨铮 . 计算机应用研究 . 2009,第008期
4. 小世界网络拓扑下的多Agent网络传输有效性和限定性满足问题研究 [J] . 余根坚 ,钱小聪 . 计算机应用研究 . 2007,第002期
5. 全国党建工作样板支部建设之“主题党日”活动实效性研究——以轨道交通智能控制学院学生党支部主题党日活动为例 [J] . 周颖勇 . 新丝路:中旬 . 2020,第004期
6. 在规范中限定水泥最小用量的利与弊——"现行标准和规范对混凝土最小水泥用量限定问题"主题沙龙纪实 [C] . . 第七期全国混凝土矿物掺和料应用技术研讨会 . 2014
7. 基于主题策略的网络爬行器算法研究 [A] . 蔡阳波 . 2008

限定主题的智能网络爬行器研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅