首页> 中文学位 >基于颜色聚类和连通域分析的视频文本提取方法
【6h】

基于颜色聚类和连通域分析的视频文本提取方法

代理获取

目录

文摘

英文文摘

第一章 绪论

1.1 研究背景

1.2 研究内容

1.3 研究意义

1.4 论文组织结构

第二章 文本提取研究综述

2.1 文本的图像特征分析

2.1.1 文本尺寸

2.1.2 文本颜色和亮度

2.1.3 文本与背景对比度

2.1.4 文本字体及比例

2.1.5 文本分布

2.1.6 文本间隙

2.1.7 文本的稳定性

2.1.8 文本背景

2.2 视频文本分类

2.3 文本提取的研究现状

2.3.1 文本提取研究现状介绍

2.3.2 典型的文本提取方法

2.4 本章小结

第三章 基于颜色聚类和连通域分析的文本提取方法

3.1 基于颜色聚类和连通域分析的文本提取方法流程

3.2 图像增强技术

3.2.1 双线性插值

3.2.2 拉普拉斯算子

3.2.3 中值滤波

3.2.4 直方图均衡化

3.3 颜色聚类技术

3.3.1 K—Means算法介绍

3.3.2 K—Means算法要点

3.3.3 判断聚类结果

3.4 连通域分析技术

3.5 背景填充技术

3.6 本章小结

第四章 原型系统设计与实现

4.1 系统原理介绍

4.2 系统模块设计

4.3 系统模块实现

4.3.1 图像增强

4.3.2 颜色聚类

4.3.3 二值图像连通区域标记

4.3.4 由外向内填充

4.4 本章小结

第五章 系统功能展示与性能分析

5.1 系统功能展示

5.2 系统效果展示

5.2.1 标题类文本

5.2.2 复杂背景文本

5.2.3 处理失败文本

5.3 系统性能分析

5.4 本章小结

第六章 总结与展望

6.1 本文工作总结

6.2 下一步研究方向

参考文献

致谢

攻读硕士学位期间发表的论文

展开▼

摘要

视频中的文本信息是辅助理解视频内容的重要线索,有效地提取这些文本信息对视频内容的自动理解及检索等应用来说无疑是一项关键的技术。目前,商业OCR对普通图像的识别达到了相对成熟的水平,但是对于背景复杂、干扰强烈的视频文本图像的识别还不能有效地应对。通过文本提取方法使视频文本图像能够被OCR系统正确识别,是本文主要解决的问题。
   针对视频中文本背景复杂、干扰强烈等问题,在对前人相关工作进行分析、研究的基础上,本文提出一种基于颜色聚类和连通域分析的文本提取方法。即使用文本检测和定位作为前处理步骤,综合利用文本的颜色分量信息及连通域信息,尽可能多地提取文本信息,同时利用连通域填充等降噪方法最大限度地减少干扰,得到能够被OCR正确识别的清晰的二值图像。
   本文提出并实现的文本提取方法在视频文本提取系统中得到成功的应用,使该系统完整地实现了从输入视频到产生OCR识别结果的总体流程。实验结果表明,本文提出的文本提取方法是鲁棒的和有效的。

著录项

  • 作者

    张赫;

  • 作者单位

    北京邮电大学;

  • 授予单位 北京邮电大学;
  • 学科 计算机科学与技术
  • 授予学位 硕士
  • 导师姓名 马华东;
  • 年度 2010
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP391.41;
  • 关键词

    颜色聚类; 连通域分析; 文本提取; OCR识别;

  • 入库时间 2022-08-17 10:19:48

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号