首页> 中文会议>《通信学报》学术论坛暨2011云计算学术会议 >基于MapReduce虚拟机的Deep Web数据源发现方法

基于MapReduce虚拟机的Deep Web数据源发现方法

页面导航

摘要
著录项
相似文献
相关主题

摘要

为了提高Deep Web爬虫发现和搜集数据源的效率，提出了一种融合MapReduce和虚拟化技术实现DeepWeb海量数据挖掘的并行计算方法。基于MapReduce架构提出了一个Deep Web爬虫模型，通过链接过滤分类、页面过滤分类、表单过滤分类等3个MapReduce过程找到DeepWeb数据源接口，并利用虚拟机构建单机集群进行性能测试。实验结果显示该方法可以实现大规模数据的并行处理，有效提高爬虫数据源发现的效率，避免网络及物理资源的浪费，验证了云计算技术在Deep Web数据挖掘方面的可行性。

著录项

来源
《《通信学报》学术论坛暨2011云计算学术会议》|2011年|189-195|共7页
会议地点苏州
作者
辛洁; 崔志明; 赵朋朋; 张广铭; 鲜学丰;
展开▼
作者单位

通信学报编辑部;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类 TP393.01;
关键词
数据源发现; MapReduce; Deep Web; 虚拟化技术; 云计算;
入库时间 2022-08-17 11:12:44

相似文献

中文文献
外文文献
专利

1. 基于MapReduce虚拟机的Deep Web数据源发现方法 [J] . 辛洁 ,崔志明 ,赵朋朋 . 通信学报 . 2011,第007期
2. 基于本体的Deep Web数据源发现方法 [J] . 李道申 ,刘勇 . 计算机工程 . 2012,第004期
3. 基于本体和语义相似度的Deep Web数据源发现技术 [J] . 卓林 . 计算机光盘软件与应用 . 2012,第020期
4. 基于搜索引擎的Deep Web数据源发现 [J] . 王海龙 ,胡景芝 ,赵朋朋 . 计算机工程 . 2011,第005期
5. 基于搜索引擎的Deep Web数据源发现技术 [J] . 李文骏 ,崔志明 . 计算机技术与发展 . 2008,第008期
6. 面向领域的Deep Web数据源发现与识别 [C] . 李英军 ,聂铁铮 ,申德荣 . 2009中国计算机大会 . 2009
7. Deep Web数据源发现及选择方法研究 [A] . 赵娜 . 2009

基于MapReduce虚拟机的Deep Web数据源发现方法

摘要

著录项

相似文献

相关主题

期刊订阅