首页> 中文学位 >视频文本定位和增强算法研究
【6h】

视频文本定位和增强算法研究

代理获取

目录

文摘

英文文摘

声明

第1章绪论

1.1课题背景

1.2研究现状

1.2.1视频文本提取的研究现状

1.2.2视频文本增强的研究现状

1.3本文的内容及结构

第2章视频文本处理相关技术简介

2.1视频文本

2.1.1视频中文本的分类

2.1.2视频中文本的特点

2.1.3视频中文本提取的难点

2.2 OCR简介

2.3基于内容的视频检索

2.3.1基于内容的视频检索系统简介

2.3.2基于内容的视频数据处理流程

2.3.3本文所作工作在系统中所处的位置

2.4视频文本图像处理系统结构

2.5本章小结

第3章视频文本定位算法研究

3.1小波变换概述

3.1.1连续小波变换

3.1.2离散小波变换(DWT)

3.1.3几种常见的小波

3.1.4图像的二维正交小波分解

3.2形态学简介

3.3神经网络的基本原理及网络的选择

3.3.1人工神经网络的基本原理

3.3.2常用神经网络及网络的选择

3.4基于小波和神经网络的视频文本定位算法研究

3.4.1离散小波变换处理

3.4.2特征提取

3.4.3神经网络的训练和识别

3.4.4实验结果分析

3.5本章小结

第4章视频文本增强算法研究

4.1文本图像分辨率增强处理

4.1.1数字图像处理中常用的插值算法概述

4.1.2基于Shannon插值的分辨率增强算法研究

4.1.3实验结果分析及比较

4.2视频文本图像的有效二值化处理

4.2.1彩色图像的灰度转换

4.2.2图像分割阈值选取技术概述

4.2.3基于Niblack二值化方法的文本图像增强算法研究

4.2.4实验结果分析及比较

4.3本章小结

第5章视频文本处理系统软件实现

5.1 MATLAB简介

5.1.1 MATLAB的功能和组成

5.2 C++Builder简介

5.3 C++Builder与Matlab混合编程的实现途径

5.4视频文本处理系统软件平台

5.3本章小结

总 结

参考文献

攻读硕士学位期间发表和投出的学术论文

致谢

展开▼

摘要

随着多媒体技术的发展和网络数据量的巨大增长,视频检索已经越来越引起人们的重视。在基于内容的视频检索技术中,视频文本是重要的索引内容。提取视频中的文本后用OCR软件识别,则可以建立视频内容的索引或快速浏览。以前这些文本大都是通过人工提取的,如果能够实现快速的自动文本定位提取,将大大节省人力物力。在提取出文本区域后,由于视频中的文本图片普遍具有分辨率低质量差的特点,如不进行增强处理,很难被OCR软件准确识别。因此,如何对提取出的视频文本进行有效的增强以提高OCR识别正确率日渐受到关注。 本文主要研究视频文本图像的定位和增强技术,提出了定位和增强方面的几种新方法,并实现了几种传统算法以进行对比实验。除了对算法进行深入研究以外,还使用了C++ Builder与Matlab混合编程搭建了视频文本处理系统软件平台。 首先提出了一种基于小波变换和神经网络技术的文本定位方法。该方法将小波良好的时频局部特性和变尺度特性同神经网络的自学习、强鲁棒性和推广能力结合起来发挥作用。在特征提取过程中,首次将峭度信息引入文本提取领域。取得了良好的效果。算法效率大大提高,定位的准确率也被提高到90.4%左右。为了证明峭度特征的有效性,还对传统的常用于神经网络分类的统计特征进行了对比实验。 其次,提出了一种基于Shannon插值的文本分辨率增强算法。并针对视频文本的特点对公式进行了改进,提高了算法执行速度。为了证明Shannon插值方法的有效性,本文还实现了几种常用的插值方法用以进行对比实验。实验结果表明经Shannon插值方法处理的图像结果更加平滑,灰度过渡的更好,且大大提高的OCR的识别正确率。 最后,提出了一种基于Niblack二值化方法的文本图像增强算法。通过大量实验,确定了在视频文本增强领域中Niblack二值化公式中相关参数的最佳取值。同时,分析了Niblack方法存在的不足,提出了一个崭新的偏移量S的计算公式,从而形成改进的Niblack二值化算法。为了证明算法有效性,本文还实现了几种常用的二值化方法用以进行对比实验。实验结果表明,经改进的Niblack二值化方法处理后的图像,笔画清晰,并且消除了条纹状噪声。经过分辨率增强和有效的二值化后,OCR正确识别率被提高到89%左右。测试过程中,对于一些质量较好的图片,OCR正确识别率可达到95%以上。

著录项

  • 作者

    赵天雪;

  • 作者单位

    北京工业大学;

  • 授予单位 北京工业大学;
  • 学科 信号与信息处理
  • 授予学位 硕士
  • 导师姓名 孙光民;
  • 年度 2008
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

    视频检索,文本定位,增强算法,插值方法;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号