首页> 外文期刊>電子情報通信学会技術研究報告 >複雑背景中の多色テロップの認識方式の検討
【24h】

複雑背景中の多色テロップの認識方式の検討

机译:复杂背景下彩色圆锥体的识别方法研究

获取原文
获取原文并翻译 | 示例
       

摘要

We propose a caption recognition method for multi-color characters on complex background. Caption characters are used for an efficient search on a large amount of recorded TV programs. In the caption character recognition, the caption appearance section and the area is extracted, the character patterns are extracted from the area, and recognized. This paper focuses on caption character patterns extraction and recognition for multi-color characters on complex background that conventional methods are difficult to recognize them. The proposed method extracts decomposed binary images from input color caption image by color clustering. Then character candidates that are composed of combination of connect components are extracted by using recognized certainty. Finally, characters are selected by beyond-color Dynamic Programming method in which weight on recognition certainty, character alignment, and continuity of color are used. In the character recognition evaluation of one-line multi-color character string on a complex background, a great improvement was achieved from a conventional technique that can recognize only one-color characters on complex background image.%映像中の複雑背景上の多色文字列の認識手法を提案する.大量に録画されたTV 番組の効率的な検索方法としてテロップ文字情報を使用する方法が挙げられる.テロップ文字認識では,テロップ領域と出現区間を求め,求めた領域内部から文字パターンを抽出し認識を行う.従来は,複雑な背景や複数の文字色が使用されるテロップの文字パターン抽出が困難であったため,背景の一様性や文字色に対する制約を設ける必要があった.本報告では,この制約を緩和するための一方式として,カラーテロップ画像を色によって分解し,各色分解画像上に現れる文字候補から文字列を再構成する方式を提案する.文字列の再構成では,各分解画像で得られた文字候補に対する文字認識確信度,文字の並びの連続性,色の連続性をコストとしたDynamic Programming(DP)法によって文字列を構成する文字を選択する.複雑背景上の一行多色文字列の文字認識評価で,従来の一行同一色に対応したテロップ認識技術よりも認識再現率で大幅な向上を実現した.
机译:针对复杂背景下的多色字符,我们提出了一种字幕识别方法。字幕字符用于在大量录制的电视节目上进行有效搜索。在字幕字符识别中,提取字幕出现部分和区域,从该区域提取字符图案并进行识别。本文主要研究复杂背景下传统方法难以识别的字幕字符模式的提取和识别。所提出的方法通过颜色聚类从输入的颜色标题图像中提取分解后的二进制图像。然后,通过使用公认的确定性来提取由连接组件的组合组成的候选字符。最后,通过超越色彩的动态编程方法来选择字符,其中使用了对识别确定性,字符对齐和颜色连续性的权重。在复杂背景下的单行多色字符串的字符识别评估中,相对于仅能识别复杂背景图像上的一种颜色字符的传统技术,已取得了很大的进步。%映像中の复雑背景上の多ににされためためためためためためためためためためためためためためためためためためた领域内部は文字パターンを抽出し认识を行が。従来は,复雑な背景や复数の文字色であったため使用されるテロップの文字パターン抽出が困难であったため,背景の一様性や文字に対する必要的があった。列の再构成では,各分解画像で得られた文字候补に対する文字认识公认度,文字の并びの连続性,色の连続性をコストとした动态编程(DP)法によって文字列を构成する文字を选択する。复雑背景上の一行多色文字列の文字认识评価で,従来の一行同一色に対応したテロップ认识技术よりも认识再现率で明显な向上を実现した。

著录项

  • 来源
    《電子情報通信学会技術研究報告》 |2011年第467期|p.61-66|共6页
  • 作者单位

    (株)富士通研究所ソフト&ソリ研究所言語・メディア研究部 〒211-8588 川崎市中原区上小田中4-1-1;

    Fqjitsu Research and Development Center Co.,Ltd,13/F;

    Tbwer A;

    Ocean International Center,No.56 Dong Si Huan Zhong Rd,Chaoyang District,Beijing 100025,P.R. China;

    (株)富士通研究所ソフト&ソリ研究所言語・メディア研究部 〒211-8588 川崎市中原区上小田中4-1-1;

    (株)富士通研究所ソフト&ソリ研究所言語・メディア研究部 〒211-8588 川崎市中原区上小田中4-1-1;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 jpn
  • 中图分类
  • 关键词

    多色テロップ; 文字認識; 色クラスタリング;

    机译:多色字幕;字符识别;颜色聚类;

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号