首页> 外文期刊>電子情報通信学会技術研究報告. デ-タ工学. Data Engineering >文字認識と単語レイアウト解析を用いた紙文書とデジタルデータの情報リンク手法
【24h】

文字認識と単語レイアウト解析を用いた紙文書とデジタルデータの情報リンク手法

机译:利用字符识别和文字布局分析对纸质文件和数字数据进行信息链接的方法

获取原文
获取原文并翻译 | 示例

摘要

文字認識と単語レイアウト解析技術を用いて,読み取った複数単語の配置関係から,文書の種別や読み取り位置を特定する手法を提案する.また,この手法を用いて,紙文書とデジタルデータのハイパーリンクを実現するプロトタイプを開発した.具体的には,カメラ付き携帯電話で紙面上の複数の単語を読み取って,その認識結果と単語の配置関係をサーバに送信し,サーバ側であらかじめ作成しておいたテキストデータと照合して,文書の種別,ページ番号,ページ中の位置を特定し,関連する情報を携帯電話に返信する.この技術を用いれば,バーコード等を文書に印刷することなくハイパーリンクが実現できる.また既に出版された文書に新たなサービスを付加することができる.4種の新聞を用いた小規模な実験で,97%の精度で新聞種の特定を,また新聞種が特定できればほぼ正しいページ位置を特定できることがわかった.今後は実験の規模を拡大するとともに,本方式を用いた様々なサービスの検討を行う予定である.
机译:我们提出了一种通过使用字符识别和单词布局分析技术从多个单词的排列中识别文档类型和阅读位置的方法。我们还开发了一个原型,该原型可以使用此方法实现纸质文档和数字数据之间的超链接。具体地,带相机的移动电话读取纸上的多个单词,将识别结果和单词排列关系发送给服务器,并将其与在服务器侧预先创建的文本数据进行核对。指定文档类型,页码和在页面上的位置,并将相关信息返回到手机。通过使用该技术,无需在文档上打印条形码即可实现超链接。另外,可以将新服务添加到已经发布的文档中。在使用四种类型的报纸的小规模实验中,发现可以以97%的准确性识别报纸类型,如果可以识别报纸类型,则可以识别几乎正确的页面位置。将来,我们计划扩大实验规模,并使用这种方法研究各种服务。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号