【24h】

ロバスト推定を用いた文字列傾き補正手法

机译:使用鲁棒估计的字符串倾斜校正方法

获取原文
获取原文并翻译 | 示例
           

摘要

OCRの認識精度が下がる要因の1つとして,文字列が紙面に対して水平でない場合に,1文字ごとに文字を切り出す処理の失敗が上げられる.筆者らは文書画像の輪郭や文書用紙の枠線,および罫線が存在しない1行文字列を対象とし,急な角度の傾き角でも補正が可能な最小2乗法を用いる補正手法を提案している.しかしながら,画像内の文字種によっては外れ値によって誤差が大きくなる問題点が確認されている.外れ値があるデータに対する直線の推定にはロバスト推定が有効である事が知られている.本稿では従来法であるコーナー検出を用いた文字列傾き補正手法にロバスト推定を組み合わせることで,外れ値が生じる文字種に対応できる文字列傾き補正手法を提案する.結果として提案法が93.67%のOCRの認識率であったが,提案法では95.53%の認識率と従来法より高い精度を得ることができた.
机译:作为降低OCR识别准确性的因素之一,如果字符串没有水平到纸张表面,则可以导致故障为每个字符缩小字符。作者提出了一种使用最小二乘方法的校正方法,即使在突然角度的倾斜角度,以及文档图像的轮廓和文档的边界的单行字符串也没有校正礼物。。但是,根据图像中的字符类型,根据异常值,误差变大。众所周知,鲁棒估计对于具有异常值的数据的直线估计是有效的。在本文中,我们提出了一种字符串倾斜校正方法,可以通过将字符串倾斜校正方法中的鲁棒估计与作为传统方法的角度检测相结合来应付出异常值的字符串校正方法。结果,该方法的识别率为93.67%OCR,但在所提出的方法中,可以获得比常规方法的95.53%的识别率和更高的精度。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号