首页> 外文期刊>電子情報通信学会技術研究報告 >K-meansクラスタリングとサポートベクターマシンを用いた情景内カラー文字列の2値化
【24h】

K-meansクラスタリングとサポートベクターマシンを用いた情景内カラー文字列の2値化

机译:使用K-means聚类和支持向量机对场景中的颜色字符串进行二值化

获取原文
获取原文并翻译 | 示例
       

摘要

This paper proposes a new technique for binalizing color character strings in scene images. The key ideas are as follows. (1) Generation of candidate binarized string images via every dichotomization of K clusters obtained by K-means clustering in the color space. (2) Every candidate binarized string image is divided into a set of tentative single-character images which are fed into the SVM to output the degree of "character-likeness." (3) The binarized string image with the maximum average of "character-likeness" is output as an optimal binarization result. Experiments made on a total of 1000 character strings extracted from the ICDAR2003 robust word recognition dataset show that the proposed method achieves a correct binarization rate of 91.6%.%本報告では情景内カラー文字列の最適2値化手法を提案する.処理の流れは,①カラー空間でのK-meansクラスタリングにより複数の2値化候補文字列画像の生成する,②各候補画像を1文字単位画像に仮分割して特徴量を算出し、文字・非文字の2クラス分類を行うサポートベクターマシンに入力する,③出力値の平均スコアが最大となる候補画像を最適2値化結果として出力する.ICDAR2003 robust OCR datasetの個別文字画像1000枚でサポートベクターマシンの学習を行い,ICDAR2003 robust word recognition datasetの文字列画像1000枚で2値化実験を行った結果,正しい2倍化率91.6%を達成した.
机译:本文提出了一种对场景图像中的颜色字符串进行二值化的新技术,其主要思想如下:(1)通过在色彩空间中通过K均值聚类获得的K簇的每二分法生成候选二值化字符串图像。 )将每个候选二值化字符串图像划分为一组暂定的单字符图像,这些图像将被馈送到SVM中以输出“字符相似度”。(3)二值化字符串图像的最大平均值为“字符相似度” “作为最佳二值化结果输出。从ICDAR2003鲁棒性单词识别数据集中提取的总共1000个字符串的实验表明,该方法实现了正确的二值化率为91.6%。%。我们提出了一种最佳的二值化方法。处理流程如下:(1)在色彩空间中通过K-means聚类生成多个二值化的候选字符串图像;(2)将每个候选图像临时划分为逐个字符的图像,计算特征量,以及输入执行非字符两类分类的支持向量机,(3)输出具有最大平均输出值得分的候选图像作为最佳二值化结果。通过对具有1000个ICDAR2003鲁棒性OCR数据集的单个字符图像的支持向量机进行学习,并对1000个ICDAR2003鲁棒性词识别数据集的字符串图像进行二值化实验,正确的加倍率为91.6%。实现了。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号