首页> 外文OA文献 >A unifying semantic distance model for determiningud the similarity of attribute values
【2h】

A unifying semantic distance model for determiningud the similarity of attribute values

机译:用于确定 ud的统一语义距离模型 属性值的相似性

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

The relative difference between two data values is ofudinterest in a number of application domains includingudtemporal and spatial applications, schema versioning,uddata warehousing (particularly data preparation), internetudsearching, validation and error correction, anduddata mining. Moreover, consistency across systems inuddetermining such distances and the robustness of suchudcalculations is essential in some domains and useful inudmany. Despite this, there is no generally adopted approachudto determining such distances and no accommodationudof distance within SQL or any commerciallyudavailable DBMS.udFor non-numeric data values calculating the differenceudbetween values often requires application-specificudsupport but even for numeric values the practicaluddistance between two values may not simply beudtheir numeric difference or Euclidean distance.udIn this paper, a model of semantic distance isuddeveloped in which a graph-based approach is usedudto quantify the distance between two data values.udThe approach facilitates a notion of distance, bothudas a simple traversal distance and as weighted arcs.udTransition costs, as an additional expense of passingudthrough a node, are also accommodated. Furthermore,udmultiple distance measures can be incorporatedudand a method of ‘localisation’ is discussed which allowsudrelevant information to take precedence over lessudrelevant information. Some results from our investigations,udincluding our SQL based implementation, areudpresented.
机译:在许多应用程序域中,两个数据值之间的相对差异是受关注的,包括时空和空间应用程序,模式版本控制, uddata仓库(尤其是数据准备),Internet udsearch,验证和错误纠正以及 uddata挖掘。而且,在某些领域中,确定此类距离的系统间一致性以及此类计算的鲁棒性是必不可少的,并且在许多领域中都是有用的。尽管如此,仍没有普遍采用的方法 ud来确定这种距离,也没有在SQL或任何商业可用DBMS中调整 udof距离。 ud对于非数字数据值,计算它们之间的差异 ud通常需要针对特定​​应用 udsupport,即使对于数字值,两个值之间的实际 uddist可能也不能简单地是其数值差或欧几里得距离。 ud本文开发了一种语义距离模型,其中使用了基于图的方法 ud来量化距离在两个数据值之间。 ud此方法简化了距离的概念,既有简单的遍历距离,又有加权弧。 ud也包含转换成本,以及通过节点的额外开销。此外,可以采用“多距离”度量,并讨论了一种“本地化”方法,该方法可以使“不相关信息”优先于“不相关”信息。我们提供了一些调查结果,包括基于SQL的实现。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号