首页> 外国专利> Methods for efficiently and systematically searching stock, image, and other non-word-based documents

Methods for efficiently and systematically searching stock, image, and other non-word-based documents

机译:有效,系统地搜索库存,图像和其他非单词文档的方法

摘要

One embodiment of a non-word-based information retrieval system includes searching stock or image documents in a huge data source. A non-word-based document is first divided into a series of elements or an array of cells. Each element or cell is matched against a series of predefined token patterns, so that a match will generate a token having a name. The collection of the generated named tokens is a word-based representation of the non-word-based document. After tokens from all documents are collected in a master collection of tokens, the non-word-based documents can be efficiently and systematically searched in a manner analogous to a document search in a word-based search system.
机译:非基于单词的信息检索系统的一个实施例包括在巨大的数据源中搜索股票或图像文档。首先,将基于单词的文档分为一系列元素或单元格数组。每个元素或单元都与一系列预定义的令牌模式匹配,因此匹配将生成具有名称的令牌。生成的命名令牌的集合是非基于单词的文档的基于单词的表示形式。在将所有文档的令牌收集到令牌的主集合中之后,可以类似于在基于单词的搜索系统中进行文档搜索的方式来高效,系统地搜索非基于单词的文档。

著录项

  • 公开/公告号US8898171B2

    专利类型

  • 公开/公告日2014-11-25

    原文格式PDF

  • 申请/专利权人 SIZHE TAN;

    申请/专利号US20100699972

  • 发明设计人 SIZHE TAN;

    申请日2010-02-04

  • 分类号G06F17/30;G06K9/46;G06K9/38;

  • 国家 US

  • 入库时间 2022-08-21 15:17:28

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号