元搜索
元搜索的相关文献在1999年到2022年内共计118篇,主要集中在自动化技术、计算机技术、信息与知识传播、科学、科学研究
等领域,其中期刊论文84篇、会议论文8篇、专利文献68463篇;相关期刊63种,包括情报杂志、现代情报、现代图书情报技术等;
相关会议8种,包括2013年第三届全国情报学博士生学术论坛、上海市老科学技术工作者协会第九届学术年会、第二十二届全国计算机信息管理学术研讨会等;元搜索的相关文献由246位作者贡献,包括丁振国、施水才、李红梅等。
元搜索—发文量
专利文献>
论文:68463篇
占比:99.87%
总计:68555篇
元搜索
-研究学者
- 丁振国
- 施水才
- 李红梅
- 李鹏
- 汤小春
- 翁勍力
- 赵捧未
- 于峰
- 付晓东
- 何劲
- 刘利军
- 刘合兵
- 刘春生
- 刘金红
- 刘骊
- 周利华
- 周柏宇
- 周水生
- 周赞
- 威廉·麦坎德利斯
- 孙素芬
- 寇净磊
- 尹文科
- 尹泽林
- 张峻峰
- 徐伟群
- 时金桥
- 曹林
- 朱明
- 李全刚
- 李广进
- 李振龙
- 李琴琴
- 李英健
- 李青山
- 束妮娜
- 杨治秋
- 林文渊
- 沈志辉
- 王学宾
- 王梅嘉
- 王美琪
- 罗长寿
- 蔺一帅
- 袁再江
- 赵时海
- 赵璨
- 邓战涛
- 郑建英
- 郭海凤
-
-
刘登洪;
徐贤
-
-
摘要:
随着网络的普及,网上检索成为了人们获取信息的主要方式.目前的搜索引擎相对独立,覆盖范围比较有限.相比之下,元搜索能够更好地满足用户的检索需求.当用户在元搜索提供的统一界面中输入一个查询时,元搜索会将处理后的用户请求发送给相关的成员搜索引擎.但是一个重要的问题是如何识别出潜在的搜索引擎以便更好地处理用户的请求.鉴于此提出了一种基于遗传算法的选择机制,该方法将各个成员搜索引擎的权重考虑在内.实验结果表明,该方法确实能够提高引擎选择中的效率和精度.%With the popularity of network,searching online becomes the main way to get information.Compared to independent search engine usually with limited coverage,meta search engine can meet the needs of information retrieval in a better way.When a query is input in the unified interface provided by meta search,it first processes the query and then sends it to appropriate member search engines.An important problem is how to find the underlying search engines which can optimally reply to the user query.In this paper,we proposed a mechanism based on genetic algorithm,which also takes the weight of each member search engine into account.The experimental results show that our method can indeed improve efficiency and accuracy on engine selection.
-
-
汤小月;
余伟;
李石君
-
-
摘要:
Much work has been done to implement metasearch engines with different rank aggregation methods.However,those methods do not have the ability to deal with the exploding data from huge amount of Web sources as well as the multiplying requirements of metasearch users.In this paper,we take the view that the rank aggregation problem can be solved with a multi-objective optimizer if the quality requirements of a user are considered along with the queries,and we find that the user's preferences among those quality requirements can help reduce the solution space.Accordingly,we propose an evolutionary rank aggregation algorithm based on user preferences.We bring a new encoding scheme for MOPSO,leverage new definitions of position and velocity,modify initialization methods of the particle swarms,improve the turbulence operator,and adjust strategies of external archive updating and leader selection,aiming at building a discrete multi-objective optimizer based on decomposition and dominance (D3MOPSO) to map out the best aggregated ranking quickly and accurately from a large-scale discrete solution space.We have the proposed algorithm along with several state-of-the-art rank aggregation methods tested on 4 datasets of different sizes: the LETOR MQ2008-agg dataset,a Web dataset,a synthetically simulated dataset and an extended Web dataset.The experiment results demonstrate that our method outperforms machine-learning-based algorithms and other multi-objective evolutionary algorithms by convergence,performance and efficiency especially when dealing with the large-scale metasearch rank aggregation tasks.%随着网络数据的爆发式增长和用户需求的多元化发展,现有元搜索排序聚合方法在精度和性能上面临着巨大挑战.以满足用户的多重需求和个性化偏好为目标,提出了一种新的元搜索排序聚合算法.通过重新定义多目标粒子群优化算法(multi-objective particle swarm optimization,MOPSO)中粒子的属性,调整速度变化因子,改进种群初始化和演化机制,设计新的存档与更新策略以及引导微粒选择策略,提出了一个基于支配分解的离散多目标优化(D3MOPSO)算法,使其能根据用户的质量需求偏好在大规模离散解空间中快速准确地找出最优解集.在多个数据集上的实验结果表明:当数据规模较小时,D3MOPSO算法的精度和性能接近机器学习排序聚合方法;在大规模数据环境下,其精度和性能优于机器学习方法以及同类多目标优化方法.
-
-
刘思尧;
施科峰
-
-
摘要:
设计了一种基于元搜索的事件发现与关联算法.首先利用元搜索引擎获取事件数据的外围信息,通过事件发现算法,实现事件的重排序,再以重排序结果为基础,识别其中出现的事件元素,进而实现事件在多维元素上的关联.实验证明该算法能够取得较好的效果.%A method to detect events based on meta-search and correlation algorithm is designed in this paper .The meta-search engine is first used to collect event' s raw information from Internet ,which is reordered to discover the event's related information .Furthermore ,the event's arguments are identified , and then event correlation is implemented .The experiment results show that the algorithm can find main factors and developing trend of the events .
-
-
吴经伟;
刘学亮
-
-
摘要:
目的:主题爬虫是用户获取领域知识的一种有效途径.为实现此方法用户首要解决的问题是主题向量的训练数据的选择和初始URLs的选择.但传统的主题爬虫对于初始URLs的选取并没有过多论述,为此,本文探讨了初始URLs对于主题爬虫的影响,并提出了一种基于元搜索和本体结合的算法来选择并确定初始URLs.方法:采用元搜索方法获取与主题相关的初始URLs,然后根据返回结果采用本体领域知识进行重排序,选择前排的URLs.自动而不是人工地进行初始URLs的确定,同时将页面信息作为训练主题向量的语料.结果:通过对比实验,本文选取的初始URLs比随机选择的要有更高的收获比.从获取总量上看,本文的方法能获得更多的相关网页.结论:通过实验证明主题团的存在,通过本文方法能够选择质量更好的初始URLs,获取主题向量训练语料,发现更多主题团,并且方便用户对于主题爬虫的定制.
-
-
-
苏金波;
朱剑宇;
杨柳;
刘跃
-
-
摘要:
Traditional approaches to harmful information detection on the Internet are based on Google,Baidu etc. ,users enter keywords for search,and then need to study the results obtained,however users often do not accurately describe the information they want,the key-words given by users are inaccurate,the search results often include what users don't want,some data which users care cannot be listed. It explores a crawler method based on meta-search,which introduces technology of keyword expansion. The method expands keywords in the Web capture and user query to improve information coverage and accuracy,with low cost and good effect,which can be applied to other domain with some extension.%传统的互联网有害信息发现方法是依据Google、百度等元搜索工具,用户输入关键词进行检索,然后对获取的结果进行研判,但是用户经常无法准确地描述所需的资料,给出的关键词不准确,搜索结果常有用户不关心的垃圾数据,而一些有用的数据却不能列出。文中探讨了一种基于元搜索,引入关键词扩充技术的爬虫方法。该方法在网页抓取,用户检索的时候能扩充输入的关键词,从而提高搜索覆盖率和精度。该方法投入小,效果好,还可通过扩展应用到其他领域。
-
-
许智宏;
康有淞;
王兰君
-
-
摘要:
We improve the existing web information extraction technology base on the analysis of the network commodity information features,and design a metasearch technology-based network commodity information extraction model.It achieves the automatic determination of the search range,webpage search and automatic extraction of the network commodity information.Through search test on a large number of commodity information,the model shows good effects in automatic determination of the capture range and automatic extraction of commodity information.%在分析网络商品信息特点的基础上,改进现有的 Web 信息提取技术,设计一种基于元搜索技术的网络商品信息提取模型,实现对搜索范围的自动确定、网页搜索、以及商品信息的自动抽取。通过大量商品信息的搜索测试,在抓取范围的自动确定和商品信息的自动抽取上取得了很好的效果。
-
-
徐伟群;
马旸
-
-
摘要:
基于JSSH (Java script shell server)的元搜索引擎构建技术为“元搜索”在省内互联网网络环境治理的研究与部署给出了一种实践方案.结合江苏本省接入的域名库,对Baidu、Soso两个搜索引擎的搜索结果进行重新整合以提高结果的有效性,这种高效的元搜索引擎作为省内网络环境治理工作中不良信息获取方式的补充,为有互联网环境治理需求的单位提供了一种有力的技术手段.
-
-
徐伟群;
马旸
-
-
摘要:
基于JSSH (Java script shell server)的元搜索引擎构建技术为“元搜索”在省内互联网网络环境治理的研究与部署给出了一种实践方案.结合江苏本省接入的域名库,对Baidu、Soso两个搜索引擎的搜索结果进行重新整合以提高结果的有效性,这种高效的元搜索引擎作为省内网络环境治理工作中不良信息获取方式的补充,为有互联网环境治理需求的单位提供了一种有力的技术手段.
-
-
-
-
翁勍力;
施水才;
赵捧未;
李渝勤
- 《第二十届全国计算机信息管理学术研讨会》
| 2006年
-
摘要:
网络信息量的增长对情报业提出了更高的挑战,面对众多搜索引擎返回的不同结果,人们无法对信息价值进行判断并进行情报分析。本文根据目前情报分析的需要,设计了一个基于元搜索与聚类技术的多维分析模型,分析了各层的基本原理,并根据功能定义了各个层的数据模型。此模型能够良好集成异构成员引擎的优势,对它们的更新、删除等变化能够灵活反应,并且能够适当获取网页信息,进行文本聚类,并在聚类基础上进行多维分析。
-
-
彭庆波;
郭波
- 《第九届计算机工程与工艺全国学术年会》
| 2005年
-
摘要:
论文提出了一个基于多agent的个性化元搜索系统模型,旨在帮助Internet用户快速准确地搜索到符合自己需求的Internet信息.该模型以agent作为架构系统的基本组件,使用已有的搜索引擎,并且可以让搜索系统的用户之间相互协作,利用agent的自治性和协作性来完成用户的个性化Internet信息的搜索,从而弥补现有系统在自适应用户兴趣方面的不足,提高系统检索信息的精确性和易用性.
-
-
-
-
-
李卫星;
康南生;
牛文琪;
王慧桥
- 《第二届全国Web信息系统及其应用会议(WISA2005')》
| 2005年
-
摘要:
在使用搜索引擎时,表达用户搜索意图的关键词之间通常具有语义关系;网页中词语之间的语义关系表达了网页的主题.搜索引擎在考虑关键词匹配的同时,还应考虑关键词关系的匹配,才能进一步提高搜索的精度.网页摘要,对其文本进行词法分析和句法分析,进而本文概括了关键词间的四个基本关系,通过追踪用户感兴趣的提取关键词之间的语义关系,计算目标网页的关系匹配度,并据此对搜索结果重新排序.在元搜索系统的应用表明,关系匹配明显地提高了搜索的精度.
-
-
-