首页> 中国专利> 一种基于深度学习的视频字幕提取方法

一种基于深度学习的视频字幕提取方法

摘要

本发明公开了一种基于深度学习的视频字幕提取方法,步骤(1)、以固定的采样频率挑选出含有字幕的图片作为训练数据集;步骤(2)、将每一张图片做二值化处理,把经过二值化处理后的图片作为标签;步骤(3)、使用训练数据集和对应的图片标签,构成CNN字幕提取模型;步骤(4)、将新的视频流以固定频率采样,获得新的含有字幕的有序图片;步骤(5)、将步骤(4)获得的新的含有字幕的有序图片输入到训练好的深度学习模型中,输出含有字幕的二值图片;步骤(6)、使用光学字符识别技术将模型输出的二值图片进行识别,生成对应的字幕文本文件。本发明为视频字幕编辑、翻译等工作提供一种获取字幕文本的方法。

著录项

  • 公开/公告号CN109409359A

    专利类型发明专利

  • 公开/公告日2019-03-01

    原文格式PDF

  • 申请/专利权人 天津大学;

    申请/专利号CN201811116759.0

  • 发明设计人 刘昱;马翔宇;

    申请日2018-09-25

  • 分类号G06K9/32(20060101);G06K9/62(20060101);

  • 代理机构12201 天津市北洋有限责任专利代理事务所;

  • 代理人李素兰

  • 地址 300072 天津市南开区卫津路92号

  • 入库时间 2024-02-19 08:11:37

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-03-26

    实质审查的生效 IPC(主分类):G06K9/32 申请日:20180925

    实质审查的生效

  • 2019-03-01

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号