首页> 外国专利> SYSTEM AND METHOD FOR GLOBAL IDENTIFICATION IN A COLLECTION OF DOCUMENTS

SYSTEM AND METHOD FOR GLOBAL IDENTIFICATION IN A COLLECTION OF DOCUMENTS

机译:文件集中的全局标识的系统和方法

摘要

Techniques for machine-based identification of objects extracted from text documents in natural language are disclosed. An example method may comprise: identifying matching pairs of one or more information objects corresponding to a real world object, one information object from the document and at least one information object from the document storage for a combination of global identification patterns that exist in the document and in the document storage; ascertaining consistency of the matching pairs and determining which of the one or more information objects in the document are suitable for merging into the document storage; and adding the one or more information objects from the document to the document storage to associate information objects corresponding to the real world object.
机译:公开了用于基于机器识别从自然语言的文本文档中提取的对象的技术。一种示例方法可以包括:针对存在于文档中的全局标识模式的组合,识别与现实对象,来自文档的一个信息对象和来自文档存储器的至少一个信息对象相对应的一个或多个信息对象的匹配对。以及在文件存储中;确定匹配对的一致性,并确定文档中一个或多个信息对象中的哪一个适合合并到文档存储中;将来自文档的一个或多个信息对象添加到文档存储中,以关联与现实世界对象相对应的信息对象。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号