基于图像处理实时识别视频流中数字信息的研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

在某侦察系统中，无人机搜索目标，在视频中实时叠加目标坐标信息字幕后，传到处理系统，处理系统根据需要截取相关画面，录入相关信息形成情报。由于无法自动获取目标坐标信息，需要人工从视频图像中读取再录入，增加了情报录入时间和出错概率，导致情报的实时性和可靠性降低。
　　本文以叠加了目标坐标信息的视频为研究对象，从视频每帧图像字幕中提取坐标信息，对图像采取灰度化、图像增强、二值化、梯度锐化、去离散噪声、图像分割等预处理方法，通过调用成熟 OCR识别模块实现坐标的快速提取，具体研究工作体现在以下两大部分：
　　第一部分介绍了DirectShow相关理论知识，包括Filter、Filter Graph Manager、媒体类型、VMR、DMO等，概要介绍了DirectShow应用程序开发的基本步骤与方法。
　　第二部分研究了从视频每帧图像字幕中提取坐标信息，包括：
　　(1)介绍了图像预处理的相关理论知识，包括颜色模型、灰度直方图、图像的噪声和平滑滤波、图像的灰度变换以及图像的二值化等，概要介绍了复杂背景下文本图像的二值化方法。
　　(2)研究了视频字幕文字提取技术，介绍了视频字幕文字提取步骤，常用字幕定位及字符提取方法，着重介绍了差值放大和混合阀值二值化方法，介绍了文字的极性判断和基于连通域分析的背景像素过滤技术。
　　(3)设计视频采集API和字符识别API二次开发接口。选用DLL(动态链接库)的方式提供二次开发接口，为用户从活动视频抓取含图像字幕的图像帧以及从中提取坐标信息提供方便。同时在某侦察系统情报采集模块中使用本文设计的API接口完成系统改造，实现与原有系统的无缝集成。

著录项

作者
李坤林;
展开▼
作者单位

电子科技大学;

展开▼
授予单位电子科技大学;
学科电子与通信工程
授予学位硕士
导师姓名刘钊;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP391.41;
关键词
视频采集; 灰度变换; 图像增强; 字符识别;
入库时间 2022-08-17 11:21:17

相似文献

中文文献
外文文献
专利

1. 基于视频流的实时清晰人脸图像识别的实现 [J] . 祝敏 ,刘伟 ,周航 . 电视技术 . 2011,第019期
2. 基于实时视频流的车型识别系统设计 [J] . 张全元 ,戴光明 ,陈良 . 微计算机信息 . 2008,第031期
3. 基于弹性图匹配的实时视频流人脸识别 [J] . 薛理立 ,艾海舟 . 计算机科学 . 2003,第011期
4. 基于图像处理的车牌识别系统的研究与实现 [J] . 石红兰 . 机电信息 . 2011,第021期
5. 基于图像处理的车牌识别系统的研究与实现 [J] . 石红兰 . 机电信息 . 2011,第021期
6. 一种新的基于实时视频流的车型识别算法 [C] . 张全元 ,戴光明 ,陈良 . 第三届图像图形技术与应用学术会议 . 2008
7. 自然教室中基于视频流的人脸识别系统的研究与实现 [A] . 刘祝峰 . 2011

基于图像处理实时识别视频流中数字信息的研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅