可爬取Ajax数据的搜索引擎爬虫研究与设计

代理获取

页面导航

摘要
著录项
相似文献
相关主题

摘要

近年来web2.0技术得到了广泛应用，新技术在改善人们浏览网页习惯的同时也给其它相关技术带来了巨大挑战，搜索引擎就是其中之一。面对网页中蕴含的大量动态数据，传统搜索引擎已经无法实现抓取功能，Ajax应用的各种状态和事件可以被用户看到，但无法被搜索引擎抓取。
　　针对搜索引擎所面临的挑战，本文给出了相应的解决方案：分析并建立Ajax应用的状态模型，在此基础之上设计并实现了Ajax爬虫的核心算法，通过建立热点缓存模型实现了算法的优化，根据Ajax动态页面的特点提出了网页权重评定算法AjaxRank，最后通过实例测试验证了Ajax搜索引擎的检索结果质量，并对搜索引擎的各项性能指标进行了综合评估。
　　本文的重要意义在于，对Ajax动态数据的应用原理进行了深入细致的分析，在此基础之上，设计并实现了可抓取Ajax动态数据的搜索引擎，为动态数据抓取的进一步研究提供了一定意义的理论基础。

著录项

作者
王岩;
展开▼
作者单位

长春理工大学;

展开▼
授予单位长春理工大学;
学科计算机应用技术
授予学位硕士
导师姓名尹大力;
年度 2011
页码
总页数
原文格式 PDF
正文语种中文
中图分类程序语言、算法语言;
关键词
Ajax数据; 搜索引擎; 网络爬虫; 抓取功能;

相似文献

中文文献
外文文献
专利

1. 支持Ajax的Deep Web爬虫研究与设计 [J] . 周杨 . 计算机系统应用 . 2012,第002期
2. 基于Python的基因表达数据网络爬虫研究与设计 [J] . 秦成鑫 ,黄锎靓 ,康华 . 信息与电脑 . 2020,第010期
3. 爬取公开数据行为的刑法规制误区与匡正--从全国首例“爬虫”入刑案切入 [J] . 石经海 ,苏桑妮 . 北京理工大学学报：社会科学版 . 2021,第4期
4. 典型产品数据搜索引擎平台研究与设计 [J] . Hui Guanglun . 黄山学院学报 . 2019,第003期
5. 基于Internet的空间数据搜索引擎的研究与设计 [J] . 傅明 ,史长琼 . 电脑与信息技术 . 2000,第004期
6. 采集Ajax网页信息的网络爬虫研究与实现 [C] . 王佳 ,魏慧琴 . 中国计算机用户协会网络应用分会2011年第十五届网络新技术与应用年会 . 2011
7. 支持AJAX的互联网搜索引擎爬虫设计与实现 [A] . 罗兵 . 2007

可爬取Ajax数据的搜索引擎爬虫研究与设计

摘要

著录项

相似文献

相关主题

期刊订阅