...
首页> 外文期刊>電子情報通信学会技術研究報告. 言語理解とコミュニケーション. Natural Language Understanding and Models of Communication >A study on document retrieval system for large-scale database based on OCR and character shape information
【24h】

A study on document retrieval system for large-scale database based on OCR and character shape information

机译:基于OCR和字符形状信息的大规模数据库文档检索系统研究

获取原文
获取原文并翻译 | 示例
           

摘要

Making a large database of electronic documents from paper documents has left a tremendous problem. In order to search the database for an image document, it is necessary for general electronic filing systems to convert the document into texts using OCR. However, the system cannot retrieve documents that do not contain correct character codes. We had before proposed a document retrieval method that reduces false drops and false alarms by using the "shape-feature" technique that describes the outline of the character's shape. We have studied this method for large-scale database by using parallel processing and confirmed its effect.
机译:从纸质文件中制作大型电子文件数据库留下了巨大的问题。 为了搜索图像文档的数据库,常规电子归档系统必须使用OCR将文档转换为文本。 但是,系统无法检索不包含正确字符代码的文档。 我们之前提出了一种文档检索方法,通过使用描述字符形状轮廓的“形状特征”技术来减少假滴和误报。 我们通过使用并行处理和确认其效果研究了这种方法的大规模数据库。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号