要解决的问题:提供一种图像文档处理设备和图像文档处理方法,其中,每个图像文档处理设备和图像文档处理方法均被改进以实现更高的搜索精度。
解决方案:从图像文档中剪切由M个字符组成的字符串的图像,并将该图像划分为单独的字符,并基于图像特征N(从以字符为单位存储字符图像的图像特征的字符图像特征字典和MxN-的第一索引矩阵中,选择N> 1(整数)个相似度从高到低的字符图像作为候选字符。准备被剪裁的字符串的第th个单元。由构成第一索引矩阵的第一列的多个候选字符组成的候选字符串,根据预定的语言模型进行词法分析,从而将候选字符串调整为字符串的第二索引矩阵这是很有意义的,在语言模型中,进行统计,然后进行词法分析。
版权:(C)2009,日本特许厅&INPIT
公开/公告号JP2009026288A
专利类型
公开/公告日2009-02-05
原文格式PDF
申请/专利权人 SHARP CORP;
申请/专利号JP20070246158
申请日2007-09-21
分类号G06T1;G06F17/30;
国家 JP
入库时间 2022-08-21 19:40:06