本稿では,カラー情景画像を対象に,①RGB成分毎の微分画像に対して2値化処理を施してそれらの和をエッジ成分として抽出し,②エッジ成分の連結領域毎の外接矩形に対する空間的配置の条件から2文字以上横に並ぶ文字列領域を抽出し,③1文字のみから成る文字列の抽出には文字候補領域内のエッジ成分の方向分布特徴に基づく文字/非文字の判定を行い,④文字間接触による横長のエッジ連結領域に対しては仮分割を施してから文字/非文字判定を行うことで接触文字列の抽出も可能とする,統合的な文字列抽出手法を提案する.ICDAR2003公開データセットに含まれる249枚の画像に本手法を適用し,再現率67.6%,適合率62.9%,F値65.1%を達成した.%This paper proposes a method for character string extraction from scene images using direction distribution of edge components and their spatial arrangements. First, we detect edge components using Canny operator as applied to individual RGB channels. Second, we extract character strings based on spatial arrangements of edge components. Third, we extract isolated characters using direction distribution features of edge components. Finally, we extract concatenated characters based on tentative segmentation into character-like components and evaluation of character likeness. Experimental results made on a total of 249 images extracted from ICDAR2003 dataset show that the proposed method achieves a recall rate of 67.6%, a precision rate of 62.9%, and a F measure of 65.1%.
展开▼