首页> 外文期刊>電子情報通信学会技術研究報告 >OCR ソフトOCRopus への数式認識モジュールの組込みの検討
【24h】

OCR ソフトOCRopus への数式認識モジュールの組込みの検討

机译:将数学表达识别模块集成到OCR软件OCRopus中的研究

获取原文
获取原文并翻译 | 示例
           

摘要

This paper describes embedding a mathematical formula recognition module into open source OCR system OCRopus aiming at developing a OCR system for scientific and technical documents which include mathematical formulas. OCRopus is a research open source OCR system emphasizing modularity, easy extensibility, and reuse. This system has several basic components such as preprocessing, layout analysis, text line recognition, so it is easy to embed the mathematical formula recognition module into OCRopus.%本研究では,オープンソースのOCR ソフトであるOCRopus に数式認識モジュールを組込み,数式を含む文書画像認識システムの構築を目的としている.OCRopus は広範囲の文書電子化を目指した.モジュール性,拡張性,再利用性に優れた実験的なOCR システムである.OCRopus は,前処理,レイアウト解析,テキストライン認識等の機能をモジュールとして持っており,数式認識モジュールの組込みが比較的容易に行える.
机译:本文描述了将数学公式识别模块嵌入到开源OCR系统OCRopus中的目的,旨在开发包含数学公式的科学技术文档的OCR系统.OCRopus是一个研究性开源OCR系统,它强调模块化,易于扩展和重用性。由于具有预处理,布局分析,文本行识别等几个基本组件,因此很容易将数学公式识别模块嵌入到OCRopus中。%在本研究中,数学公式识别模块已集成到开放式OCR软件OCRopus中,并且目的是建立包括的文件图像识别系统。 OCRopus旨在广泛的电子文档。这是一个实验性OCR系统,具有出色的模块化,可扩展性和可重用性。 OCRopus作为模块具有预处理,布局分析和文本行识别等功能,并且数学表达式识别模块可以相对容易地安装。

著录项

  • 来源
    《電子情報通信学会技術研究報告》 |2011年第467期|p.177-182|共6页
  • 作者单位

    信州大学大学院工学系研究科 〒380-8553 長野県長野市若里む17-1;

    信州大学大学院工学系研究科 〒380-8553 長野県長野市若里む17-1;

    信州大学大学院工学系研究科 〒380-8553 長野県長野市若里む17-1;

    信州大学大学院工学系研究科 〒380-8553 長野県長野市若里む17-1;

    信州大学大学院工学系研究科 〒380-8553 長野県長野市若里む17-1;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 jpn
  • 中图分类
  • 关键词

    光学文字認識; OCRopus; 数式認識;

    机译:光学文字认识;OCRopus;数式认识;

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号