首页> 外国专利> Event matching by analysis of text characteristics (e-match)

Event matching by analysis of text characteristics (e-match)

机译:通过分析文本特征进行事件匹配(电子匹配)

摘要

A system and method for event matching by analysis of text characteristics are presented. A document collection comprising documents is acquired. One or more document subsets of the document collection each comprising one or more documents potentially describing identical events are identified based on certain structured metadata fields of the documents. Salient text features are extracted from the documents in the document collection. An event similarity score for pairs of documents in the document collection is generated by comparing the text features extracted from the documents. A common event document list comprising sets of documents in the document collection whose event similarity scores with each other are above a similarity threshold is generated.
机译:提出了一种通过文本特征分析进行事件匹配的系统和方法。获取包括文件的文件集合。基于文档的某些结构化元数据字段来识别文档集合的一个或多个文档子集,每个子​​集包括一个或多个潜在地描述相同事件的文档。从文档集合中的文档中提取突出的文本特征。通过比较从文档中提取的文本特征,生成文档集中文档对的事件相似性得分。生成公共事件文档列表,该公共事件文档列表包括文档集合中的文档集合,这些文档集合的彼此事件相似性得分高于相似性阈值。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号