首页> 中国专利> 一种基于深度学习的视频字幕提取方法

一种基于深度学习的视频字幕提取方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种基于深度学习的视频字幕提取方法，步骤(1)、以固定的采样频率挑选出含有字幕的图片作为训练数据集；步骤(2)、将每一张图片做二值化处理，把经过二值化处理后的图片作为标签；步骤(3)、使用训练数据集和对应的图片标签，构成CNN字幕提取模型；步骤(4)、将新的视频流以固定频率采样，获得新的含有字幕的有序图片；步骤(5)、将步骤(4)获得的新的含有字幕的有序图片输入到训练好的深度学习模型中，输出含有字幕的二值图片；步骤(6)、使用光学字符识别技术将模型输出的二值图片进行识别，生成对应的字幕文本文件。本发明为视频字幕编辑、翻译等工作提供一种获取字幕文本的方法。

著录项

公开/公告号CN109409359A

专利类型发明专利
公开/公告日2019-03-01

原文格式PDF
申请/专利权人天津大学;
展开▼

申请/专利号CN201811116759.0
发明设计人刘昱;马翔宇;
展开▼

申请日2018-09-25
分类号G06K9/32(20060101);G06K9/62(20060101);
代理机构12201 天津市北洋有限责任专利代理事务所;
代理人李素兰
地址 300072 天津市南开区卫津路92号
入库时间 2024-02-19 08:11:37

法律信息

法律状态公告日

法律状态信息

法律状态
2019-03-26

实质审查的生效 IPC(主分类):G06K9/32 申请日:20180925

实质审查的生效
2019-03-01

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种基于深度学习的视频字幕提取方法 [P] . 中国专利： CN109409359A . 2019-03-01
2. 一种基于字幕视频的镜头边界检测与关键帧提取方法 [P] . 中国专利： CN112990191A . 2021-06-18
3. The storage media present information to utilizau00c7u00e7o with a device of gravau00c7u00e7o / reproduu00c7u00e7o, method of reproduu00c7u00e7o subtitle data in text format, and the data of audio / video (AV), a device for data reproduu00c7u00e7o audio / video (AV) and subtitle data in text format, M. u00cddia of gravau00c7u00e7o passu00cdvel reading in the computer.Method for control of a device for data sincronizau00c7u00e7o audio / video (AV) with the subtitle data in text format, media present passu00cdvel reading in the computer, and method of reproduu00c7u00e7o subtitle data in text format in sicronizau00c7u00e7o with data of audio / video (AV) [P] . BRPI0507879A2 . 2009-03-10

机译：存储介质使用grava u00c7 u00e7o / reprodu u00c7 u00e7o设备，reprod u00c7 u00e7o文本格式的字幕数据以及音频 /视频数据（ AV），一种用于以文本格式复制音频 /视频（AV）和字幕数据的设备，M。 grava u00c7 u00e7o通过计算机中的读取控制设备的方法用于带有文本格式字幕数据的数据sincroniza u00c7 u00e7o音频//视频（AV），计算机中媒体当前通过 u00cdvel读取以及以sicroniza u00c7 文本格式复制字幕数据的方法u00e7o带有音频 /视频（AV）数据
4. INFORMATION STORAGE MEDIUM OF STORING INFORMATION FOR DOWNLOADING TEXT SUBTITLES, A SUBTITLE REPRODUCING METHOD AND A DEVICE THEREFOR, PARTICULARLY WITH REGARDS TO REPRODUCING A SUBTITLE CORRESPONDING TO A VIDEO REPRODUCTION STRUCTURE HAVING MULTIPLE REPRODUCTION PATHS [P] . 韩国专利： KR20050018315A . 2005-02-23

机译：用于下载文本字幕的信息存储的信息存储介质，一种字幕再现方法和一种装置，尤其是针对与具有多个再现路径的视频再现结构相对应的字幕再现
5. OPEN CAPTION SYSTEM FOR SUPPORTING TEMPLATE-BASED OPEN CAPTION EDITING AND VIDEO PLAYER INCLUDING TEMPLATE-BASED OPEN CAPTION ENGINE [P] . 韩国专利： KR20130034106A . 2013-04-05

机译：用于支持基于模板的开放字幕编辑和视频播放器（包括基于模板的开放字幕引擎）的开放字幕系统