首页> 中文学位 >面向字幕帧的视频图像文本识别
【6h】

面向字幕帧的视频图像文本识别

代理获取

目录

文摘

英文文摘

声明

第1章引言

1.1研究背景和意义

1.2国内外研究现状

1.3本文的工作

第2章视频图像文本识别技术概述

2.1视频图像文本识别系统的组成

2.1.1视频文本图像的特点

2.1.2视频图像文本识别系统的流程

2.2视频图像文本识别的关键问题

第3章视频图像文本提取

3.1视频图像文本检测

3.1.1视频图像文本检测技术概述

3.1.2基于边缘特征的字幕帧检测算法

3.2视频图像文本定位

3.2.1视频图像文本定位概述

3.2.2改进的文本定位算法

第4章视频图像文本识别预处理

4.1视频图像噪声处理技术概述

4.2视频文本图像预处理

4.2.1视频图像噪声的特点

4.2.2视频文本图像预处理算法

第5章实验结果分析

第6章结果与展望

6.1工作总结

6.2未来工作展望

参考文献

攻读硕士学位期间发表论文情况

致谢

展开▼

摘要

随着多媒体技术的发展,视频已成为人们获取信息的渠道。面对海量的视频数据库,如何快速有效地进行视频检索已成为研究热点。视频中的字幕信息为视频检索提供了可能。
   本文主要对视频文件中字幕帧检测和文本定位方法展开研究。首先根据梯度区域值等特征来判断视频帧图像中是否含有字幕;然后采用改进的基于形态学的文本定位方法对检测到的字幕帧图像进行字幕区域定位;为了保证视频文本识别的正常进行,在对几种图像插值算法分析的基础上,选用了适合视频图像的基于最大熵的阈值分割算法对提取出的字幕帧图像进行去噪;最后引进OCR(Optical Characters Recognition,光学字符识别)技术对其进行文字识别。实验表明,本文提出的方法能有效避免虚假的文本区域,对不同的视频图像有较强的适应性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号