首页> 外国专利> TEXT DATA SIMILARITY CALCULATION METHOD, TEXT DATA SIMILARITY CALCULATION APPARATUS, AND TEXT DATA SIMILARITY CALCULATION PROGRAM

TEXT DATA SIMILARITY CALCULATION METHOD, TEXT DATA SIMILARITY CALCULATION APPARATUS, AND TEXT DATA SIMILARITY CALCULATION PROGRAM

机译:文本数据相似度计算方法,文本数据相似度计算装置和文本数据相似度计算程序

摘要

PPROBLEM TO BE SOLVED: To provide a text data similarity calculation method for accurately calculating a similarity between texts. PSOLUTION: The text data similarity calculation method comprises: a weighting factor calculation step (S102) for extracting words from a plurality of text data, analyzing modification information between the words (S101), and calculating the weighting factor of each word, based on the number of extracted words; an interword similarity calculation step for generating structured data of the text data (S103), based on the modification information between the word in the text data extracted by a word information extraction step to calculate the similarity between each word of a first structured data generated from one piece of the text data by a structured data generation step and each word of a second structured data generated from one piece of other text data; and a partial structured data similarity calculation step (S105) for calculating the similarity between the first structured data and the second structured data on the basis of the similarity calculated by the interword similarity calculation step and the weighting factor. PCOPYRIGHT: (C)2006,JPO&NCIPI
机译:

要解决的问题:提供一种文本数据相似度计算方法,用于准确计算文本之间的相似度。

解决方案:文本数据相似度计算方法包括:加权因子计算步骤(S102),用于从多个文本数据中提取单词,分析单词之间的修饰信息(S101),并计算每个单词的加权因子,根据提取的单词数;单词间相似度计算步骤,用于基于由单词信息提取步骤所提取的文本数据中的单词之间的修饰信息,生成文本数据的结构化数据(S103),以计算从生成的第一结构化数据的每个单词之间的相似度通过结构化数据生成步骤生成一个文本数据,并从一个其他文本数据生成第二结构化数据的每个单词;局部结构化数据相似度计算步骤(S105),用于根据由词间相似度计算步骤计算出的相似度和加权因子,计算第一结构化数据和第二结构化数据之间的相似度。

版权:(C)2006,JPO&NCIPI

著录项

  • 公开/公告号JP2006139708A

    专利类型

  • 公开/公告日2006-06-01

    原文格式PDF

  • 申请/专利权人 RICOH CO LTD;

    申请/专利号JP20040330939

  • 发明设计人 KENMOCHI EIJI;SATO NAHOKO;SHIMADA ATSUO;

    申请日2004-11-15

  • 分类号G06F17/30;G06F17/28;

  • 国家 JP

  • 入库时间 2022-08-21 21:53:21

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号