首页> 外国专利> Temporally consistent caption detection on videos using a 3D spatiotemporal method

Temporally consistent caption detection on videos using a 3D spatiotemporal method

机译:使用3D时空方法对视频进行时间一致的字幕检测

摘要

A caption detection system wherein all detected caption boxes over time for one caption area are identical, thereby reducing temporal instability and inconsistency. This is achieved by grouping candidate pixels in the 3D spatiotemporal space and generating a 3D bounding box for one caption area. 2D bounding boxes are obtained by slicing the 3D bounding boxes, thereby reducing temporal instability as all 2D bounding boxes corresponding to a caption area are sliced from one 3D bounding box and are therefore identical over time.
机译:一种字幕检测系统,其中,一个字幕区域随时间的所有检测到的字幕框均相同,从而减少了时间上的不稳定性和不一致。这是通过将3D时空空间中的候选像素分组并为一个字幕区域生成3D边框来实现的。通过切片3D边界框来获得2D边界框,从而减少了时间上的不稳定性,因为与一个字幕区域相对应的所有2D边界框都是从一个3D边界框切出的,因此随着时间的推移它们是相同的。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号