首页> 中文学位 >基于图像处理实时识别视频流中数字信息的研究与实现
【6h】

基于图像处理实时识别视频流中数字信息的研究与实现

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1 研究背景

1.2 项目介绍

1.3 本文主要研究内容

1.4 本文主要工作及贡献

第二章 视频采集技术

2.1 DirectShow相关理论知识

2.2 DirectShow应用程序开发

第三章 图像预处理技术

3.1 颜色坐标系

3.2 灰度直方图

3.3 图像的灰度变换

3.4 图像二值化方法

第四章 视频字幕文字提取技术研究

4.1 视频字幕文字提取步骤

4.2 视频图像切割

4.3 字幕区定位技术

4.4 文字图像的插值放大和混合阀值二值化方法

第五章 API接口函数的设计与实现

5.1 单帧图像采集API的设计与实现

5.2 字符识别API的设计与实现

5.3 在某侦察情报处理系统中的应用

第六章 全文总结

致谢

参考文献

攻硕期间取得的研究成果

展开▼

摘要

在某侦察系统中,无人机搜索目标,在视频中实时叠加目标坐标信息字幕后,传到处理系统,处理系统根据需要截取相关画面,录入相关信息形成情报。由于无法自动获取目标坐标信息,需要人工从视频图像中读取再录入,增加了情报录入时间和出错概率,导致情报的实时性和可靠性降低。
  本文以叠加了目标坐标信息的视频为研究对象,从视频每帧图像字幕中提取坐标信息,对图像采取灰度化、图像增强、二值化、梯度锐化、去离散噪声、图像分割等预处理方法,通过调用成熟 OCR识别模块实现坐标的快速提取,具体研究工作体现在以下两大部分:
  第一部分介绍了DirectShow相关理论知识,包括Filter、Filter Graph Manager、媒体类型、VMR、DMO等,概要介绍了DirectShow应用程序开发的基本步骤与方法。
  第二部分研究了从视频每帧图像字幕中提取坐标信息,包括:
  (1)介绍了图像预处理的相关理论知识,包括颜色模型、灰度直方图、图像的噪声和平滑滤波、图像的灰度变换以及图像的二值化等,概要介绍了复杂背景下文本图像的二值化方法。
  (2)研究了视频字幕文字提取技术,介绍了视频字幕文字提取步骤,常用字幕定位及字符提取方法,着重介绍了差值放大和混合阀值二值化方法,介绍了文字的极性判断和基于连通域分析的背景像素过滤技术。
  (3)设计视频采集API和字符识别API二次开发接口。选用DLL(动态链接库)的方式提供二次开发接口,为用户从活动视频抓取含图像字幕的图像帧以及从中提取坐标信息提供方便。同时在某侦察系统情报采集模块中使用本文设计的API接口完成系统改造,实现与原有系统的无缝集成。

著录项

  • 作者

    李坤林;

  • 作者单位

    电子科技大学;

  • 授予单位 电子科技大学;
  • 学科 电子与通信工程
  • 授予学位 硕士
  • 导师姓名 刘钊;
  • 年度 2013
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP391.41;
  • 关键词

    视频采集; 灰度变换; 图像增强; 字符识别;

  • 入库时间 2022-08-17 11:21:17

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号