【24h】

Measurement of Similarity Using Field Association Terms

机译:使用字段关联条款衡量相似性

获取原文
获取原文并翻译 | 示例

摘要

Information retrieval measured document similarity by considering all information in texts and are relatively inefficiency for processing large text collections in heterogeneous subject areas. This paper outlined a new text manipulation system FA-Sim that is useful for retrieving information in large heterogeneous texts and for recognizing content similarity in text excerpts. FA-Sim is based on flexible text matching procedures carried out in various contexts and various field ranks. FA-Sim measures texts similarity by using specific Field Association (FA) terms instead of by comparing all text information. Similarity between texts is faster and higher by using FA-Sim than other two analysis methods. Therefore, Recall and Precision significantly improved by 39% 37% over these two traditional methods.
机译:信息检索通过考虑文本中的所有信息来衡量文档的相似性,对于处理异构主题领域中的大型文本集合而言效率相对较低。本文概述了一种新的文本处理系统FA-Sim,该系统可用于检索大型异构文本中的信息以及识别文本摘录中的内容相似性。 FA-Sim基于在各种情况和不同领域等级中执行的灵活文本匹配过程。 FA-Sim通过使用特定的字段关联(FA)术语而不是比较所有文本信息来衡量文本的相似性。与其他两种分析方法相比,使用FA-Sim可以使文本之间的相似性更快,更高。因此,与这两种传统方法相比,Recall和Precision显着提高了39%37%。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号