首页> 中文学位 >基于时空域信息的视频字幕提取算法研究
【6h】

基于时空域信息的视频字幕提取算法研究

代理获取

目录

文摘

英文文摘

创新性声明及关于论文使用授权的说明

第一章绪论

1.1课题背景

1.2技术现状

1.3作者的工作

1.4论文章节安排

第二章基于内容的视频检索

2.1基于内容的多媒体检索

2.2基于内容的视频检索

2.3基于内容的视频检索的特征提取

第三章数字视频中的字幕及其提取

3.1视频中的文字分类及其特点

3.2视频字幕提取的技术难点

3.3视频字幕提取的基本步骤

第四章数字视频中的字幕检测

4.1视频数据

4.2文字事件类型

4.3视频文字检测算法分类

4.4基于模糊聚类神经网络的镜头突变检测算法

4.4.1人工神经网络概述

4.4.2自组织竞争神经网络

4.4.3模糊竞争学习算法

4.4.4基于模糊聚类神经网络的镜头突变检测

4.5字幕出现/消失检测

第五章数字视频中的字幕分割

5.1文字分割方法概述

5.1.1基于阈值的文字分割

5.1.2基于边缘的文字分割

5.1.3基于纹理的文字分割

5.2字幕区域定位

5.2.1基于模糊聚类神经网络的字幕区域定位

5.2.2一种改进的投影分割算法

第六章数字视频中的字幕识别

6.1字幕帧平均

6.1.1多帧平均法

6.1.2改进的多帧平均法

6.2字幕图像插值

6.2.1图像插值法概述

6.2.2视频字幕图像插值

6.3字幕图像二值化

6.3.1全局阈值法

6.3.2局部阈值法

6.3.3混合二值化方法

6.3.4字幕图像二值化

第七章结束语

致谢

参考文献

作者在读期间的研究成果

展开▼

摘要

视频字幕往往包含了丰富的语义信息,与视频其它特征相比,更适于用作视频索引,因而对于视频字幕提取方面的研究备受关注.该文针对字幕提取算法开展了研究.为了便于后续的视频分析,提出了一种基于模糊聚类神经网络(FCNN)的镜头突变检测算法,实现视频镜头分割,该算法具有检测精度高、对运动稳健等优点;区域定位是字幕提取的关键一环,同样利用FCNN分类器可实现字幕定位,但其运算量大,定位精度不高,因此提出了一种改进的投影分割方法实现字幕区域定位分割,实验表明其简单实用,适于实时处理;考虑到单个字符背景相对简单,为此提出了一种基于单字符的字幕二值化算法,最终在经由字符分割、二值化及残留背景像素清除之后,得到了清晰、高质的字幕图像,字符识别结果证明了这一点.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号