视频文本定位和增强算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着多媒体技术的发展和网络数据量的巨大增长,视频检索已经越来越引起人们的重视。在基于内容的视频检索技术中,视频文本是重要的索引内容。提取视频中的文本后用OCR软件识别,则可以建立视频内容的索引或快速浏览。以前这些文本大都是通过人工提取的,如果能够实现快速的自动文本定位提取,将大大节省人力物力。在提取出文本区域后,由于视频中的文本图片普遍具有分辨率低质量差的特点,如不进行增强处理,很难被OCR软件准确识别。因此,如何对提取出的视频文本进行有效的增强以提高OCR识别正确率日渐受到关注。本文主要研究视频文本图像的定位和增强技术,提出了定位和增强方面的几种新方法,并实现了几种传统算法以进行对比实验。除了对算法进行深入研究以外,还使用了C++ Builder与Matlab混合编程搭建了视频文本处理系统软件平台。首先提出了一种基于小波变换和神经网络技术的文本定位方法。该方法将小波良好的时频局部特性和变尺度特性同神经网络的自学习、强鲁棒性和推广能力结合起来发挥作用。在特征提取过程中,首次将峭度信息引入文本提取领域。取得了良好的效果。算法效率大大提高,定位的准确率也被提高到90.4％左右。为了证明峭度特征的有效性,还对传统的常用于神经网络分类的统计特征进行了对比实验。其次,提出了一种基于Shannon插值的文本分辨率增强算法。并针对视频文本的特点对公式进行了改进,提高了算法执行速度。为了证明Shannon插值方法的有效性,本文还实现了几种常用的插值方法用以进行对比实验。实验结果表明经Shannon插值方法处理的图像结果更加平滑,灰度过渡的更好,且大大提高的OCR的识别正确率。最后,提出了一种基于Niblack二值化方法的文本图像增强算法。通过大量实验,确定了在视频文本增强领域中Niblack二值化公式中相关参数的最佳取值。同时,分析了Niblack方法存在的不足,提出了一个崭新的偏移量S的计算公式,从而形成改进的Niblack二值化算法。为了证明算法有效性,本文还实现了几种常用的二值化方法用以进行对比实验。实验结果表明,经改进的Niblack二值化方法处理后的图像,笔画清晰,并且消除了条纹状噪声。经过分辨率增强和有效的二值化后,OCR正确识别率被提高到89％左右。测试过程中,对于一些质量较好的图片,OCR正确识别率可达到95％以上。

著录项

作者
赵天雪;
展开▼
作者单位

北京工业大学;

展开▼
授予单位北京工业大学;
学科信号与信息处理
授予学位硕士
导师姓名孙光民;
年度 2008
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词
视频检索,文本定位,增强算法,插值方法;

相似文献

中文文献
外文文献
专利

1. 视频文本图像增强算法研究 [J] . 赵天雪 ,孙光民 ,许爽 . 微计算机信息 . 2007,第033期
2. 北斗定位系统地基增强信号的实时精密定位算法研究 [J] . 彭义东 . 数字通信世界 . 2020,第001期
3. 彩色图像中文本内容的选择性增强算法研究 [J] . 薛宏伟 ,韩慧莲 . 计算机与数字工程 . 2009,第004期
4. 自然场景图像中的文本检测及定位算法研究——基于边缘信息与笔画特征 [J] . 李东勤 ,徐勇 ,周万怀 . 重庆科技学院学报（自然科学版） . 2019,第003期
5. 基于关键点检测的文档文本定位算法研究 [J] . 完颜勇 ,王宗贤 . 电子科技 . 2017,第012期
6. 一种基于笔画提取和条件形态学的视频文本定位方法 [C] . 王修飞 ,黄磊 ,刘昌平 . 2008年全国模式识别学术会议 . 2008
7. 结合视觉显著性的三维视频增强和视频重定位技术研究 [A] . 潘云峰 . 2015

视频文本定位和增强算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅