首页> 外文期刊>電子情報通信学会技術研究報告 >複雑な背景を持つカラー文書画像からの文字抽出
【24h】

複雑な背景を持つカラー文書画像からの文字抽出

机译:从背景复杂的彩色文档图像中提取字符

获取原文
获取原文并翻译 | 示例
       

摘要

本研究は,カラー量子化処理と2値化処理を用いて,雑誌の表紙のような複雑な背景を持つカラー文書画像から文字情報を抽出することを目的とする.カラー量子化処理には、Achantaの顕著性マップにより得られる領域分割結果を基にして、Ongによって提案された階層的SOMを改良した手法を提案する.2値化処理ではカラー量子化処理によって得られた画像を文字色ごとに分離し,それぞれ文字抽出を行い統合する手法を提案する.本研究では,Ground Truthを用いる定量的な評価法によって他手法と比較することにより,提案手法の有効性を検証する.%The purpose of this research is to extract the characters from color document images with complex background such as journal covers by using color quantization and binarization techniques. We propose an improved algorithm of color quantization based on the saliency map by Achanta's algorithm and the modified version of the Ong's SOM. We also propose an algorithm of binarization in which each color of character is once separated to extract the characters in each color plane and then extracted results are integrated to produce the binarized image. To demonstrate the effectiveness of the proposed method, we perform the comparative experiments in comparison with the other methods using the quantitative evaluation with Ground Truth.
机译:这项研究的目的是通过使用颜色量化处理和二值化处理从背景复杂的彩色文档图像(例如杂志的封面)中提取字符信息。我们基于Achanta显着图获得的区域分割结果,提出了一种改进Ong提出的分层SOM的方法。在这项研究中,我们通过使用地面真理的定量评估方法将其与其他方法进行比较,从而验证了该方法的有效性。这项研究的目的是通过使用颜色量化和二值化技术从具有复杂背景的彩色文档图像中提取字符,例如日记本封面。基于Achanta算法的显着图和Ong's的改进版本,我们提出了一种改进的颜色量化算法我们还提出了一种二值化算法,该算法将字符的每种颜色分别分离以提取每个颜色平面中的字符,然后对提取的结果进行积分以生成二值化图像。使用地面真相进行定量评估的对比实验与其他方法的对比。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号