首页> 外国专利> Spatial and temporal information for semantic segmentation

Spatial and temporal information for semantic segmentation

机译:语义分割的空间和时间信息

摘要

Systems and methods for segmenting an image using a convolutional neural network are described herein. A convolutional neural network (CNN) comprises an encoder-decoder architecture, and may comprise one or more Long Short Term Memory (LSTM) layers between the encoder and decoder layers. The LSTM layers provide temporal information in addition to the spatial information of the encoder-decoder layers. A subset of a sequence of images is input into the encoder layer of the CNN and a corresponding sequence of segmented images is output from the decoder layer. In some embodiments, the one or more LSTM layers may be combined in such a way that the CNN is predictive, providing predicted output of segmented images. Though the CNN provides multiple outputs, the CNN may be trained from single images or by generation of noisy ground truth datasets. Segmenting may be performed for object segmentation or free space segmentation.
机译:本文描述了用于使用卷积神经网络分割图像的系统和方法。卷积神经网络(CNN)包括编码器解码器架构,并且可以包括编码器和解码器层之间的一个或多个长的短期存储器(LSTM)层。除了编码器解码器层的空间信息之外,LSTM层还提供时间信息。将一系列图像序列的子集输入到CNN的编码器层中,并且从解码器层输出相应的分段图像的序列。在一些实施例中,可以以这样的方式组合一个或多个LSTM层,使得CNN是预测的,提供分段图像的预测输出。虽然CNN提供多个输出,但是CNN可以从单个图像训练或通过生成嘈杂的地面真理数据集。可以对对象分割或自由空间分割来执行分段。

著录项

  • 公开/公告号US11003923B2

    专利类型

  • 公开/公告日2021-05-11

    原文格式PDF

  • 申请/专利权人 ZOOX INC.;

    申请/专利号US201916241564

  • 申请日2019-01-07

  • 分类号G06K9;G06T7/174;G06N3/04;

  • 国家 US

  • 入库时间 2022-08-24 18:37:52

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号