首页> 外文期刊>電子情報通信学会技術研究報告 >ハフ変換を利用した手書き文字領域と活字領域の判別法の提案
【24h】

ハフ変換を利用した手書き文字領域と活字領域の判別法の提案

机译:利用霍夫变换判别手写字符区域与文字区域的方法

获取原文
获取原文并翻译 | 示例
       

摘要

文書の電子化が一般的に普及し,次段階として,電子化された文書の自動管理方法が求められてきている.管理の自動化には,文書中文字画像のテキスト化や重要語抽出を行うことが必要だが,電子化された文書には手書き文字と活字が混在しているケースが多く,既存のOptical Haracter Reader(OCR)を利用しただけで実現することは困難である.この問題は,手書き文字と活字を判別することで解決可能である.この判別方法として,本提案は,手書きに起因する揺らぎを利用し,手書き文字領域と活字領域を判別する手法を提案する.本手法は,ハフ変換により文字を構成する線分痛報を抽出し,線分の角度情報分布傾向を特徴量とすることで,手書きによる揺らぎを取得するものである.実際に,手書き文字,活字のサンプルを用意し,本手法を適用したところ,手書き文字と活字の角度情報の分布傾向に違いがあることを確認し,判別を実現可能であることを示すことができた.%Since digitalization of documents has been widespread nowadays, a method to automatically manage digitalized documents is required for the next stage. To realize this, it is necessary to perform character coding of text images and detect keywords. In many cases, however, since both handwritten and typed characters exist on digitalized documents, it is difficult to perform character coding and detect keywords using Optical Character Reader (OCR). This issue can be solved by identifying handwritten and typed characters. This report proposes the solution for this issue through a method of identifying the area of handwritten characters and that of typed characters using fluctuation in handwritten characters. This method obtains fluctuation by extracting line segments that form characters by using Hough transform and by quantifying the distribution tendency in the angles domain. We prepared samples of handwritten and typed characters and applied this method. As a result we confirmed that there is difference in the distribution tendency of the angles of line segments in handwritten and typed characters, which leads to the possibility to identify handwritten and typed characters.
机译:文件的数字化已经普及,下一步是需要一种数字化文件的自动管理方法,为了实现管理的自动化,将文件中的文本图像转换为文本并提取出重要单词。但是,在许多情况下,手写字符和打印字符混合在数字化文档中,并且仅通过使用现有的光学骚扰阅读器(OCR)很难实现。可以通过区分手写字符和印刷字符来解决,作为这种区分的方法,提出了一种利用手写引起的变动来将手写字符区域与印刷区域区别开的方法。通过利用霍夫变换提取构成字符的线段疼痛信息,并将线段的角度信息分布的趋势作为特征量,获得了由于手写引起的波动。通过准备和应用此方法,我们确认了手写字符和印刷字符的角度信息的分布趋势存在差异,并且能够证明判别是可行的。%由于文档已经数字化如今,下一阶段需要一种自动管理数字化文档的方法,要实现这一点,有必要对文本图像执行字符编码并检测关键字,但是在许多情况下,由于数字化文档中同时存在手写和键入字符文档中,使用光学字符读取器(OCR)很难执行字符编码和检测关键字。可以通过识别手写和键入的字符来解决此问题。本报告提出了针对此问题的解决方案这种方法是通过使用手写字符的波动来识别手写字符和打字字符的区域。该方法通过使用霍夫变换提取形成字符的线段并量化角度域中的分布趋势来获得波动,我们准备了手写样本结果,我们确认了手写和键入字符中线段的角度分布趋势存在差异,这导致识别手写和键入字符的可能性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号