要解决的问题:提供文本检索技术,以提高按冲击值顺序使用倒排文件时检索处理的处理性能。解决方案:该文本检索设备1具有检索处理器20。检索处理器20具有:检索条件输入装置,其输入由多个单词等指定的检索条件101;以及单词提取装置基于单词词典提取输入的单词组102;单词组分类是指根据预先计算出的df值,将提取出的各个单词分类为df值低的单词组和df值高的单词组。候选文档搜索装置使用针对每个具有低df值的单词组的单词在每个单词中构造的影响值顺序使用反向文件71、74,并通过使用反向文件73搜索作为输出候选的候选文档。关于具有高df值的单词组在每个单词中构造的文档ID顺序;候选文档输出装置在满足检索条件时决定并输出候选文档d16等。
版权:(C)2009,日本特许厅&INPIT
公开/公告号JP2009175826A
专利类型
公开/公告日2009-08-06
原文格式PDF
申请/专利权人 NIPPON TELEGR & TELEPH CORP NTT;
申请/专利号JP20080011125
发明设计人 ONIZUKA MAKOTO;
申请日2008-01-22
分类号G06F17/30;
国家 JP
入库时间 2022-08-21 19:43:13