机译:一种计算机可执行程序,其生成计算机可执行程序,该计算机可执行程序生成用于生成用于信息检索的数据结构的计算机系统,其方法,用于信息检索的数据结构,用于信息检索的数据结构检索系统,图形用户界面系统
要解决的问题:提供一种基于识别指示与背景高度相似的程度的元素(例如文档)簇的系统和方法,用于大规模文本的信息检索和数据挖掘数据库。解决方案:该计算机系统包括邻域补丁生成部分34,用于生成用于对数据库中存储的文档进行信息检索的数据结构,并生成在层次结构中具有规定相似性的节点组。邻域补丁生成部分34包括:层次生成部分36,用于基于文档关键词向量生成层次结构;以及补丁定义部分26。计算机系统包括聚类估计部分28,用于通过使用文档生成关键词数据库来生成文档关键词向量的聚类数据。补丁的相似性。
版权:(C)2004,日本特许厅和日本国家唱片公司
公开/公告号JP3974511B2
专利类型
公开/公告日2007-09-12
原文格式PDF
申请/专利权人 インターナショナル・ビジネス・マシーンズ・コーポレーション;
申请/专利号JP20020368276
发明设计人 マイケル・エドワード・フール;
申请日2002-12-19
分类号G06F17/30;
国家 JP
入库时间 2022-08-21 21:12:22