首页> 外文会议>2018 4th International Conference on Computer and Technology Applications >A new clustering approach to identify the values to query the deep web access forms
【24h】

A new clustering approach to identify the values to query the deep web access forms

机译:一种新的聚类方法,用于标识查询深层Web访问表单的值

获取原文
获取原文并翻译 | 示例

摘要

The deep web is a huge part of the web only accessible by querying its access forms. To query these access forms, we need to know the possible values of each form field. But, some form fields have an undefined set of values and this makes their automatic query difficult or impossible. In this paper, we propose our new approach to identify the set of the possible values for these fields to query the deep web access forms. For this, we query first these fields with the values associated with the domain of the deep web source. After, we use the K-medoids clustering approach to classify these generated results in a K clusters. For this, our clustering approach uses the semantic similarity between these results. The elements of the generated clusters are used by our approach to define the set of the possible values of these analyzed fields. With this approach, we can apply efficient queries to all the fields of the deep web access forms and access the deep web information.
机译:深度网络是网络中很大的一部分,只有通过查询其访问表单才能访问。要查询这些访问表单,我们需要知道每个表单字段的可能值。但是,某些表单字段具有一组未定义的值,这使它们的自动查询变得困难或不可能。在本文中,我们提出了一种新方法来标识这些字段的可能值集,以查询深层Web访问表单。为此,我们首先使用与深层Web源的域关联的值查询这些字段。之后,我们使用K-medoids聚类方法将这些生成的结果分类为K聚类。为此,我们的聚类方法使用了这些结果之间的语义相似性。我们的方法使用生成的簇的元素来定义这些分析字段的可能值的集合。通过这种方法,我们可以对深度Web访问表单的所有字段进行有效的查询,并访问深度Web信息。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号