首页> 外国专利> Being the document similarity calculation device, the clustering device and the document

Being the document similarity calculation device, the clustering device and the document

机译:作为文档相似度计算设备,聚类设备和文档

摘要

PPROBLEM TO BE SOLVED: To efficiently perform clustering and document extraction by computing document similarity used as an absolute value, with high accuracy without depending on a document size. PSOLUTION: This document similarity computing device is provided with an input part 11 for inputting a document set, and a normalization part 14 for computing similarity used as the relative value between the documents in the inputted document set, respectively on a plurality of combinations of documents by a tf-idf method using a document vector and the importance of words included in the documents, and converting each similarity into an absolute value by normalization. PCOPYRIGHT: (C)2003,JPO
机译:

要解决的问题:通过计算用作绝对值的文档相似度来高效地执行聚类和文档提取,而无需依赖于文档大小就可以实现高精度。

解决方案:该文档相似度计算设备分别在多个文档编辑器上分别具有用于输入文档集的输入部11和用于计算相似度的归一化部14,所述相似度用作所输入的文档集中的文档之间的相对值。使用文档向量和文档中包含的单词的重要性通过tf-idf方法对文档进行组合,并通过归一化将每个相似度转换为绝对值。

版权:(C)2003,日本特许厅

著录项

  • 公开/公告号JP4142881B2

    专利类型

  • 公开/公告日2008-09-03

    原文格式PDF

  • 申请/专利权人 富士通株式会社;

    申请/专利号JP20020062239

  • 发明设计人 難波 功;

    申请日2002-03-07

  • 分类号G06F17/30;

  • 国家 JP

  • 入库时间 2022-08-21 20:19:15

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号