首页> 中文学位 >基于SOM的视频中人工文本检测方法研究
【6h】

基于SOM的视频中人工文本检测方法研究

代理获取

目录

文摘

英文文摘

第1章 绪论

1.1 课题背景及意义

1.2 国内外研究现状

1.3 论文的主要研究内容

1.4 论文的组织结构

第2章 文本检测相关理论与技术

2.1 文本检测方法概述

2.2 边缘特征提取方法综述

2.2.1 特征提取的原则

2.2.2 基于边缘算子的特征提取方法

2.3 SOM 基本原理

2.3.1 SOM简介

2.3.2 SOM的结构

2.3.3 SOM的学习过程及学习算法

2.3.4 分类器设计的原则和目标

2.4 形态学基本理论

2.4.1 二值形态学运算

2.4.2 形态学常用算法

2.5 本章小结

第3章 有导师SOM分类器的设计与研究

3.1 神经网络学习规则简介

3.2 SOM的特点分析

3.3 有导师SOM分类器的设计

3.3.1 有导师SOM的结构

3.3.2 有导师SOM的学习算法

3.4 特征的选择与提取

3.5 本章小结

第4章 有导师SOM分类器的性能分析

4.1 样本向量的设计与样本集的获得

4.2 非限定性人工文本区域的定位

4.2.1 有导师SOM分类器的训练

4.2.2 文本区域的初步定位

4.3 文本区域的精确定位和后期处理

4.3.1 目标文本区域的精确定位

4.3.2 目标文本区域的后期处理

4.4 有导师SOM的性能分析

4.4.1 在简单分类问题中的性能分析

4.4.2 在文本检测中的性能分析

4.5 本章小结

结论

参考文献

攻读硕士学位期间发表的论文和取得的科研成果

致谢

展开▼

摘要

视频中的人工文本是表达视频语义信息的重要手段之一,对它的有效检测、定位与提取对于视频的分析理解和检索等应用都具有十分重要的意义。
   论文在对现有文本检测方法的研究基础上,针对大多数文本检测方法受到文本位置与语种的限制问题,给出一种视频中非限定性人工文本区域的检测方法。首先,重点研究SOM神经网络的特点,提出一种基于有导师学习的SOM神经网络分类器,从而使SOM在文本检测中能够对分类后的像素进行分类标记。其次,根据视频中人工文本区域存在强烈边缘的特点,采用Sobel边缘检测算子提取图像的边缘特征,提取出的特征作为特征向量的一部分。因为视频中人工文本区域与背景存在着明显的边缘,而Sobel算子不但具有方向性并且它检测到的边缘一般大于两个像素,能较好地描述图像边缘特征。然后,针对人工文本区域出现位置不同的问题,结合分类器的结构,给出区分人工文本区域与背景的特征向量的基本形式,利用有导师SOM分类器初步定位目标文本区域。最后,采用基于形态学的方法对目标文本区域进行处理,用以处理由于分类器的误判而出现的一些噪声点和空洞,并对精确定位的目标文本区域进行后期处理。实验表明,论文给出的方法能够有效检测并定位视频中的非限定性文本区域。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号