您现在的位置: 首页> 研究主题> 元搜索


元搜索的相关文献在1999年到2022年内共计118篇,主要集中在自动化技术、计算机技术、信息与知识传播、科学、科学研究 等领域,其中期刊论文84篇、会议论文8篇、专利文献68463篇;相关期刊63种,包括情报杂志、现代情报、现代图书情报技术等; 相关会议8种,包括2013年第三届全国情报学博士生学术论坛、上海市老科学技术工作者协会第九届学术年会、第二十二届全国计算机信息管理学术研讨会等;元搜索的相关文献由246位作者贡献,包括丁振国、施水才、李红梅等。



论文:84 占比:0.12%


论文:8 占比:0.01%


论文:68463 占比:99.87%





  • 丁振国
  • 施水才
  • 李红梅
  • 李鹏
  • 汤小春
  • 翁勍力
  • 赵捧未
  • 于峰
  • 付晓东
  • 何劲
  • 期刊论文
  • 会议论文
  • 专利文献




    • 刘登洪; 徐贤
    • 摘要: 随着网络的普及,网上检索成为了人们获取信息的主要方式.目前的搜索引擎相对独立,覆盖范围比较有限.相比之下,元搜索能够更好地满足用户的检索需求.当用户在元搜索提供的统一界面中输入一个查询时,元搜索会将处理后的用户请求发送给相关的成员搜索引擎.但是一个重要的问题是如何识别出潜在的搜索引擎以便更好地处理用户的请求.鉴于此提出了一种基于遗传算法的选择机制,该方法将各个成员搜索引擎的权重考虑在内.实验结果表明,该方法确实能够提高引擎选择中的效率和精度.%With the popularity of network,searching online becomes the main way to get information.Compared to independent search engine usually with limited coverage,meta search engine can meet the needs of information retrieval in a better way.When a query is input in the unified interface provided by meta search,it first processes the query and then sends it to appropriate member search engines.An important problem is how to find the underlying search engines which can optimally reply to the user query.In this paper,we proposed a mechanism based on genetic algorithm,which also takes the weight of each member search engine into account.The experimental results show that our method can indeed improve efficiency and accuracy on engine selection.
    • 汤小月; 余伟; 李石君
    • 摘要: Much work has been done to implement metasearch engines with different rank aggregation methods.However,those methods do not have the ability to deal with the exploding data from huge amount of Web sources as well as the multiplying requirements of metasearch users.In this paper,we take the view that the rank aggregation problem can be solved with a multi-objective optimizer if the quality requirements of a user are considered along with the queries,and we find that the user's preferences among those quality requirements can help reduce the solution space.Accordingly,we propose an evolutionary rank aggregation algorithm based on user preferences.We bring a new encoding scheme for MOPSO,leverage new definitions of position and velocity,modify initialization methods of the particle swarms,improve the turbulence operator,and adjust strategies of external archive updating and leader selection,aiming at building a discrete multi-objective optimizer based on decomposition and dominance (D3MOPSO) to map out the best aggregated ranking quickly and accurately from a large-scale discrete solution space.We have the proposed algorithm along with several state-of-the-art rank aggregation methods tested on 4 datasets of different sizes: the LETOR MQ2008-agg dataset,a Web dataset,a synthetically simulated dataset and an extended Web dataset.The experiment results demonstrate that our method outperforms machine-learning-based algorithms and other multi-objective evolutionary algorithms by convergence,performance and efficiency especially when dealing with the large-scale metasearch rank aggregation tasks.%随着网络数据的爆发式增长和用户需求的多元化发展,现有元搜索排序聚合方法在精度和性能上面临着巨大挑战.以满足用户的多重需求和个性化偏好为目标,提出了一种新的元搜索排序聚合算法.通过重新定义多目标粒子群优化算法(multi-objective particle swarm optimization,MOPSO)中粒子的属性,调整速度变化因子,改进种群初始化和演化机制,设计新的存档与更新策略以及引导微粒选择策略,提出了一个基于支配分解的离散多目标优化(D3MOPSO)算法,使其能根据用户的质量需求偏好在大规模离散解空间中快速准确地找出最优解集.在多个数据集上的实验结果表明:当数据规模较小时,D3MOPSO算法的精度和性能接近机器学习排序聚合方法;在大规模数据环境下,其精度和性能优于机器学习方法以及同类多目标优化方法.
    • 刘思尧; 施科峰
    • 摘要: 设计了一种基于元搜索的事件发现与关联算法.首先利用元搜索引擎获取事件数据的外围信息,通过事件发现算法,实现事件的重排序,再以重排序结果为基础,识别其中出现的事件元素,进而实现事件在多维元素上的关联.实验证明该算法能够取得较好的效果.%A method to detect events based on meta-search and correlation algorithm is designed in this paper .The meta-search engine is first used to collect event' s raw information from Internet ,which is reordered to discover the event's related information .Furthermore ,the event's arguments are identified , and then event correlation is implemented .The experiment results show that the algorithm can find main factors and developing trend of the events .
    • 吴经伟; 刘学亮
    • 摘要: 目的:主题爬虫是用户获取领域知识的一种有效途径.为实现此方法用户首要解决的问题是主题向量的训练数据的选择和初始URLs的选择.但传统的主题爬虫对于初始URLs的选取并没有过多论述,为此,本文探讨了初始URLs对于主题爬虫的影响,并提出了一种基于元搜索和本体结合的算法来选择并确定初始URLs.方法:采用元搜索方法获取与主题相关的初始URLs,然后根据返回结果采用本体领域知识进行重排序,选择前排的URLs.自动而不是人工地进行初始URLs的确定,同时将页面信息作为训练主题向量的语料.结果:通过对比实验,本文选取的初始URLs比随机选择的要有更高的收获比.从获取总量上看,本文的方法能获得更多的相关网页.结论:通过实验证明主题团的存在,通过本文方法能够选择质量更好的初始URLs,获取主题向量训练语料,发现更多主题团,并且方便用户对于主题爬虫的定制.
    • 周光军; 王欣宇; 杨帆; 蔡成军; 祖卓红; 李颖; 刘建
    • 摘要: 步入21世纪以来,国家在迈向第三步战略目标的进程中,提出迎接工业化、城镇化和信息化的奋斗目标,世界开始进入知识经济时代,图书馆作为重要的信息资源基地,成为信息资源和知识的直接提供者,对信息化、网络化浪潮的冲击更为敏感。在数字化应用遍布全球的当今,建筑材料工业技术情报研究所坐拥建材行业唯一一个建材工业科技图书馆是服务于全行业的知识宝库,至今建筑材料工业技术情报研究所图书馆每年仍保持着大量的技术图书、文献等资料的引进和更新,是建材行业宝贵的科技信息资源库,其数字化转换建设势必为必然。
    • 苏金波; 朱剑宇; 杨柳; 刘跃
    • 摘要: Traditional approaches to harmful information detection on the Internet are based on Google,Baidu etc. ,users enter keywords for search,and then need to study the results obtained,however users often do not accurately describe the information they want,the key-words given by users are inaccurate,the search results often include what users don't want,some data which users care cannot be listed. It explores a crawler method based on meta-search,which introduces technology of keyword expansion. The method expands keywords in the Web capture and user query to improve information coverage and accuracy,with low cost and good effect,which can be applied to other domain with some extension.%传统的互联网有害信息发现方法是依据Google、百度等元搜索工具,用户输入关键词进行检索,然后对获取的结果进行研判,但是用户经常无法准确地描述所需的资料,给出的关键词不准确,搜索结果常有用户不关心的垃圾数据,而一些有用的数据却不能列出。文中探讨了一种基于元搜索,引入关键词扩充技术的爬虫方法。该方法在网页抓取,用户检索的时候能扩充输入的关键词,从而提高搜索覆盖率和精度。该方法投入小,效果好,还可通过扩展应用到其他领域。
    • 许智宏; 康有淞; 王兰君
    • 摘要: We improve the existing web information extraction technology base on the analysis of the network commodity information features,and design a metasearch technology-based network commodity information extraction model.It achieves the automatic determination of the search range,webpage search and automatic extraction of the network commodity information.Through search test on a large number of commodity information,the model shows good effects in automatic determination of the capture range and automatic extraction of commodity information.%在分析网络商品信息特点的基础上,改进现有的 Web 信息提取技术,设计一种基于元搜索技术的网络商品信息提取模型,实现对搜索范围的自动确定、网页搜索、以及商品信息的自动抽取。通过大量商品信息的搜索测试,在抓取范围的自动确定和商品信息的自动抽取上取得了很好的效果。
    • 徐伟群; 马旸
    • 摘要: 基于JSSH (Java script shell server)的元搜索引擎构建技术为“元搜索”在省内互联网网络环境治理的研究与部署给出了一种实践方案.结合江苏本省接入的域名库,对Baidu、Soso两个搜索引擎的搜索结果进行重新整合以提高结果的有效性,这种高效的元搜索引擎作为省内网络环境治理工作中不良信息获取方式的补充,为有互联网环境治理需求的单位提供了一种有力的技术手段.
    • 徐伟群; 马旸
    • 摘要: 基于JSSH (Java script shell server)的元搜索引擎构建技术为“元搜索”在省内互联网网络环境治理的研究与部署给出了一种实践方案.结合江苏本省接入的域名库,对Baidu、Soso两个搜索引擎的搜索结果进行重新整合以提高结果的有效性,这种高效的元搜索引擎作为省内网络环境治理工作中不良信息获取方式的补充,为有互联网环境治理需求的单位提供了一种有力的技术手段.
    • 吴丽萍; 黄秋筱
    • 摘要: 随着科技的进步,互联网已深入群众,我国少数民族如蒙古族等也借助互联网弘扬本民族文化,致力于实现民族语言文字信息数字化处理。蒙古文网站数量快速增多,能够快速、全面、准确的获取蒙古文网站信息,对蒙古文信息处理发挥重要作用。为实现快速、全面、准确的获取蒙古文网站信息,利用元搜索引擎获取包含蒙古文高频语素的网页URL,根据网页文字编码范围判断其是否属于蒙古文网站,再利用各网站之间的链接获取更多的蒙古文网站。
  • 查看更多


京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号