首页> 中文学位 >三网融合下广电视频字幕的提取方法研究
【6h】

三网融合下广电视频字幕的提取方法研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

1 绪论

1.1 三网融合的背景

1.2 广电内容监管的研究意义

1.3 国内外现状

1.4 本文组织安排

2 HUSTRIM广电内容监管系统的总体设计

2.1 系统目标

2.2 系统功能

2.3 系统总体结构

2.4 本章小结

3 字幕提取子系统的分析与设计

3.1 文字检测技术分析

3.2 字幕提取子系统工作流程

3.3 字幕提取子系统功能结构

3.4 本章小结

4 字幕区域检测

4.1 字幕区域检测方法分析

4.2 字幕提取子系统中的字幕区域检测

4.3 本章小结

5 字幕的提取

5.1 OCR技术

5.2 简单背景文字提取

5.3 复杂背景文字提取

5.4 实验结果和分析

5.5 本章小结

6 总结与展望

6.1 全文总结

6.2 展望

致谢

参考文献

展开▼

摘要

电信网、广播电视网和互联网在三网融合的进程中,会面临着更加严峻的安全挑战。传统的广播电视网是相对独立和封闭的,数据传送方式是单一的自顶向下广播式发送,在新技术和新业务的驱动下,会出现终端向服务端、终端与终端间的数据传输模式。广播电视受众面广,影响力大,视频内容的监管具有重要的意义。而视频字幕包含大量的直观的信息,对其进行提取、识别和分析是整个广电视频内容监管的重要组成部分。
  在HUSTRIM(Huazhong University of Science and Technology,Software college,Television and Radio Information Management)广电内容监管系统中,针对视频字幕的提取,采用了一种基于边缘检测的方法。视频中的字幕一般是后期添加的,具有清晰的轮廓和笔画特征。根据这个特点,先对视频帧图片进行彩色边缘检测,去除图片中的无关信息,使用OTSU二值化,进一步去除背景信息,再通过形态学操作去除噪声,得到字幕区域。然后对切割后的字幕图片,分为简单背景和复杂背景两种情况。对于背景简单的字幕图片,直接对其进行二值化和OCR识别,得到字幕的文本内容。针对字幕背景复杂的情况,先对字幕图片进行边缘检测,再进行二值化和形态学操作,最后再进行OCR识别。
  对简单背景和复杂背景两种情况下的字幕图片进行实验,能准确地定位字幕区域位置,有效去除背景信息,使用OCR软件进行识别,识别率较高。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号