本研究は,カラー量子化処理と2値化処理を用いて,雑誌の表紙のような複雑な背景を持つカラー文書画像から文字情報を抽出することを目的とする.カラー量子化処理には、Achantaの顕著性マップにより得られる領域分割結果を基にして、Ongによって提案された階層的SOMを改良した手法を提案する.2値化処理ではカラー量子化処理によって得られた画像を文字色ごとに分離し,それぞれ文字抽出を行い統合する手法を提案する.本研究では,Ground Truthを用いる定量的な評価法によって他手法と比較することにより,提案手法の有効性を検証する.%The purpose of this research is to extract the characters from color document images with complex background such as journal covers by using color quantization and binarization techniques. We propose an improved algorithm of color quantization based on the saliency map by Achanta's algorithm and the modified version of the Ong's SOM. We also propose an algorithm of binarization in which each color of character is once separated to extract the characters in each color plane and then extracted results are integrated to produce the binarized image. To demonstrate the effectiveness of the proposed method, we perform the comparative experiments in comparison with the other methods using the quantitative evaluation with Ground Truth.
展开▼