首页> 外国专利> CREATING AN ONTOLOGY ACROSS MULTIPLE SEMANTICALLY-RELATED DATA SETS

CREATING AN ONTOLOGY ACROSS MULTIPLE SEMANTICALLY-RELATED DATA SETS

机译:跨多个与数学相关的数据集创建本体

摘要

Embodiments presented herein disclose techniques for generating an entity pool, a hierarchical structure of related nodes that assists with classification and comparison of dissimilar data sets. To generate the entity pool, text references and metadata are collected from a public source, such as an online encyclopedia or other text source that provides dense and structured data that focuses on identified terminology. The text references are assigned similarity scores based on contextual information provided by the metadata. The text references are clustered into nodes based on similarity. Relationships between the nodes are defined based on edges generated between the nodes.
机译:本文提出的实施例公开了用于生成实体池,相关节点的分层结构的技术,该实体池有助于对不同数据集进行分类和比较。为了生成实体池,从公共资源(例如在线百科全书库或其他文本源)收集文本引用和元数据,这些文本源提供密集且结构化的数据,这些数据集中在已确定的术语上。基于元数据提供的上下文信息,为文本引用分配相似性评分。文本引用基于相似性聚类到节点中。节点之间的关系是基于节点之间生成的边定义的。

著录项

  • 公开/公告号US2015178372A1

    专利类型

  • 公开/公告日2015-06-25

    原文格式PDF

  • 申请/专利权人 OPENGOV INC.;

    申请/专利号US201314134741

  • 发明设计人 MATTHEW SEAL;

    申请日2013-12-19

  • 分类号G06F17/30;

  • 国家 US

  • 入库时间 2022-08-21 15:25:02

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号