首页> 外文期刊>電子情報通信学会論文誌 >図形特徴に基づく手書き古文書画像の全文検索手法
【24h】

図形特徴に基づく手書き古文書画像の全文検索手法

机译:基于图形特征的手写旧文档图像全文检索方法

获取原文
获取原文并翻译 | 示例
           

摘要

近年,電子図書館やディジタルアーカイブと呼ばれる電子的な文書管理において歴史的文書をはじめとした手書き文書の電子化が重要視されている.これらの文書に対して,文字列検索の手法を提供することは,文書の活用という観点から意義が大きい.本論文では,毛筆の手書き文書画像を対象に,文字の図形としての形状特徴をもとに生成した,擬似的な文字コードを文書の内部表現として用いることで高速な全文検索を実現する手法について述べる.この手法は統計的な画像特徴量による画像検索の手法を応用したものであるため,特定のフォントや言語に依存せずに統一的な手法で適用吋能である.提案手法ではまず,文書画像を文字領域を含んだ等しい大きさの方形領域に分割し,各領域から文字の形状特徴量を抽出する.更に,この特徴量に基づいた擬似コードを各領域に付加することによって通常のテキスト文書と同等の文字列検索を画像上で実現する.また,実際に手書きの草書体古文書を対象にした文字列の検索評価実験を行い,3-gramの場合に再規準0.8において適rn合率0.53の結果を得た.また,文書画像検索に適した形状特徴量,擬似コード生成手法の評価と考察も行った.
机译:近年来,在称为电子图书馆和数字档案馆的电子文件管理中已经强调了诸如历史文件之类的手写文件的数字化。从利用文档的角度来看,提供一种用于这些文档的字符串搜索的方法是重要的。在本文中,我们提出了一种基于伪字符代码的高速全文本搜索方法,该伪字符代码是基于字符的形状特征(如图)生成的,用于笔刷的手写文档图像。描述。由于该方法是基于统计图像特征的图像检索方法的一种应用,因此无论特定的字体或语言如何,都可以将其用作统一方法。在所提出的方法中,首先,将文档图像划分成包括字符区域的相等大小的矩形区域,并且从每个区域提取字符的形状特征。此外,通过将基于该特征量的伪代码添加到每个区域,在图像上实现了与普通文本文档等效的字符串搜索。另外,我们针对手写草书旧文档进行了字符串检索和评估实验,对于3克(标准为0.8)的情况,获得了0.53的适当rn率的结果。我们还评估并考虑了适合文档图像检索的形状特征量和伪代码生成方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号