首页> 外文期刊>電子情報通信学会技術研究報告 >エッジ成分の方向分布と空間的配置に着目した情景画像からの文字列抽出
【24h】

エッジ成分の方向分布と空間的配置に着目した情景画像からの文字列抽出

机译:从场景图像中提取字符串,重点是边缘分量的方向分布和空间排列

获取原文
获取原文并翻译 | 示例
       

摘要

本稿では,カラー情景画像を対象に,①RGB成分毎の微分画像に対して2値化処理を施してそれらの和をエッジ成分として抽出し,②エッジ成分の連結領域毎の外接矩形に対する空間的配置の条件から2文字以上横に並ぶ文字列領域を抽出し,③1文字のみから成る文字列の抽出には文字候補領域内のエッジ成分の方向分布特徴に基づく文字/非文字の判定を行い,④文字間接触による横長のエッジ連結領域に対しては仮分割を施してから文字/非文字判定を行うことで接触文字列の抽出も可能とする,統合的な文字列抽出手法を提案する.ICDAR2003公開データセットに含まれる249枚の画像に本手法を適用し,再現率67.6%,適合率62.9%,F値65.1%を達成した.%This paper proposes a method for character string extraction from scene images using direction distribution of edge components and their spatial arrangements. First, we detect edge components using Canny operator as applied to individual RGB channels. Second, we extract character strings based on spatial arrangements of edge components. Third, we extract isolated characters using direction distribution features of edge components. Finally, we extract concatenated characters based on tentative segmentation into character-like components and evaluation of character likeness. Experimental results made on a total of 249 images extracted from ICDAR2003 dataset show that the proposed method achieves a recall rate of 67.6%, a precision rate of 62.9%, and a F measure of 65.1%.
机译:在本文中,对于彩色场景图像,(1)对差分图像的每个RGB分量执行二值化处理,并提取它们的总和作为边缘分量;从(2)的条件中,提取水平方向布置有两个或更多字符的字符串区域。我们提出了一种综合的字符串提取方法,该方法可以在临时划分由于字符接触而引起的水平长边连接区域之后,通过执行字符划分/非字符判断来提取接触字符串。该方法提出了一种通过使用方向从场景图像中提取字符串的方法,方法是将该方法应用于已发布的数据集中包含的249张图像,并且召回率达到67.6%,精度达到62.9%,F值达到65.1%。首先,我们使用Canny运算符检测应用于单个RGB通道的边缘分量;其次,我们根据边缘分量的空间排列来提取字符串;第三,我们使用最后,我们将基于尝试性分割的串连字符提取为字符样分量,并对字符相似度进行评估,对从ICDAR2003数据集提取的共249张图像进行实验,结果表明方法的召回率达67.6%,准确率达62.9%,F值达65.1%。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号