基于预期剩余能量模型的聚焦爬行方法

尹文科; 宗士强; 王珩

首页> 中文期刊>计算机工程与应用 >基于预期剩余能量模型的聚焦爬行方法

基于预期剩余能量模型的聚焦爬行方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

How to determine the search direction and depth are the key problem of focused crawling. This paper proposes an expected residual energy based URL priority computing method. This method uses the information of the current web page to calculate the immediately returning energy of hyperlinks, and then updates the expected residual energy using the historical returning knowledge of different historical paths in an iterative way. Using the expected residual energy as the priority and depth limit, this paper presents the system architecture of the expected residual energy based focused crawler, and gives out the detailed implementation of the key modules. Experiment result shows the focused crawler acquires bet-ter topic relevant websites finding ability.%如何确定搜索的方向和深度是聚焦爬行的核心问题.为此,提出了链接的预期剩余能量概念及其计算方法.该方法利用当前页面的信息计算链接的立即回报能量,利用到达同一链接不同历史路径给予的历史回报知识不断迭代更新链接的预期剩余能量.利用预期剩余能量作为链接的优先级和搜索深度限制,设计了基于预期剩余能量模型的聚焦爬行算法,并给出了关键模块的实现.实验结果显示该方法具有更强的主题网站发现能力.

著录项

来源
《计算机工程与应用》|2015年第24期|120-125158|共7页
作者
尹文科; 宗士强; 王珩;
展开▼
作者单位

中国电子科技集团公司第二十八研究所信息系统工程重点实验室,南京 210007;

中国电子科技集团公司第二十八研究所信息系统工程重点实验室,南京 210007;

中国电子科技集团公司第二十八研究所信息系统工程重点实验室,南京 210007;

展开▼
原文格式 PDF
正文语种 chi
中图分类 TP311.13;
关键词
聚焦爬行; 搜索方向; 搜索深度; 主题相关度; 预期剩余能量;
入库时间 2023-07-24 17:05:47

相似文献

中文文献
外文文献
专利

1. 提高最大能量法剩余静校正中模型道精度的方法 [J] . 吴波 ,潘树林 ,王荐 . 石油地球物理勘探 . 2017,第006期
2. 基于剩余电流固有模态能量特征的生物触电故障诊断模型 [J] . 王金丽 ,刘永梅 ,杜松怀 . 农业工程学报 . 2016,第021期
3. 基于超导脉冲变压器的脉冲电源剩余能量回收方法 [J] . 李海涛 ,张涛 ,安韵竹 . 电工技术学报 . 2019,第012期
4. 基于低频边缘特征和能量的多聚焦图像融合方法 [J] . 罗南超 ,向昌成 . 重庆理工大学学报（自然科学版） . 2009,第008期
5. 中国农产品期货市场通货膨胀预期成分分解——基于修正F-F模型与Hamilton方法 [J] . 刘明 ,马冠群 . 陕西师范大学学报（哲学社会科学版） . 2014,第003期
6. 基于剩余能量最大化准则的多雷达站点发射功率分配方法 [C] . 袁野 ,易伟 ,孔令讲 . 第十四届全国雷达学术年会 . -1
7. 预期幸福偏差的聚焦错觉机制探讨——基于高水平聚焦与低水平聚焦的对比分析 [A] . 鹿凡凡 . 2014

基于预期剩余能量模型的聚焦爬行方法

摘要

著录项

相似文献

相关主题

期刊订阅