【24h】

確率伝搬法を用いた帳票の論理構造認識に関する一方式

机译:使用概率传播方法形式的形式逻辑结构识别之一

获取原文
获取原文并翻译 | 示例
       

摘要

内容が共通する未知フォーマットの帳票画像から対象データを抽出する方式として、帳票上の文字列の意味とそれらの関係を表す論理構造を醍織する一方式を提案する。 本方式は、論理要素とその関係の可能性を表現した共通論理構造および帳票画像を入力とし、おのおのの論理要素に対して帳票画像中の文字列を対応付けることで、論理構造を安定的に終執する。木方式の特長は、文字列情報とその位置情報とに基づいて、論理要素との対応関係と論理要素に対応させたときの文字列間の関係とを確率的に表現することで、与えられた共通論理構造の論理要素の関係に対応した直感的な確率グラフを構成し、これに対して確率伝搬法から得られた周辺事後確率に基づいて論理要素に文字列を対応付けることによって、レイアウトに依存せずに論理要素と文字列の対応付けを可能にする点である。本方式により、多様なレイアウトや複雑な論理構造に対応可能で、文字列の内容や位置の推定誤りにも強い論理構造醍織を実現する。 本方式の有効性を三つの帳票種に対する評価実験により確認した。
机译:如从一个未知的格式,其中该内容是普通的一种形式的图像中提取对象数据的方法,我们提出了编织的逻辑结构的方法,其表示文本的含义和他们之间的关系。此方法采用的逻辑结构稳定,通过输入表达逻辑元素以及它们的关系的可能性公共逻辑结构和形式图像,并且对于每个逻辑元件相关联的形式的图像的字符串。木型特征通过概率性地表达该逻辑元素,并且当它们对应于基于所述字符串信息和其位置信息的逻辑元件的字符行之间的关系的对应关系通过配置对应的一个直观的概率曲线图给出。在布局到公共逻辑结构,并根据从概率传播方法获得的外围概率的逻辑元件上的字符串关联的逻辑元素的关系,它是一个点,它使逻辑元件和字符串的映射不依赖。通过该方法,能够应对各种布局和复杂的逻辑结构,并且实现了逻辑结构的编织的编织也就是在文字串的内容和位置估计误差抗性。这种方法的有效性是由三种形式的物种评估实验所证实。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号