要解决的问题:提供一种程序,用于估计由大量实例组成的数据库中任意实例之间的相似性,并提供记录介质和设备。
解决方案:该相似性度量估计程序由设置由大量实例组成的实例集的步骤组成;通过选择一个实例来设置所选实例集;计算正半定相似度量矩阵,该矩阵由所选实例与所有其他实例之间的相似度量组成;计算矩阵的校正Cholesky分解;通过分解矩阵计算所有其他实例的特征值;确定特征值的最大值的大小和特征值的阈值;当最大值较大时,将其他实例添加到所选实例集中;当最大值小于阈值时,通过重复每个步骤来终止重复;并通过与所选择的实例集以外的两个可选实例有关的实例向量的内积来估计两个实例的相似性度量。还提供了存储该程序的记录介质和估计装置。
版权:(C)2008,日本特许厅&INPIT
公开/公告号JP2008198080A
专利类型
公开/公告日2008-08-28
原文格式PDF
申请/专利权人 OSAKA UNIV;
申请/专利号JP20070034905
申请日2007-02-15
分类号G06N5/04;G06F17/30;G06F19;
国家 JP
入库时间 2022-08-21 20:24:24