机译:用于视频中动作识别的时间段网络
Nanjing Univ State Key Lab Novel Software Technol Nanjing 210023 Jiangsu Peoples R China;
Amazon Web Serv Seattle WA 98101 USA;
Univ Calif Irvine Dept Comp Sci Irvine CA 92697 USA;
Chinese Acad Sci Shenzhen Inst Adv Technol Shenzhen 518055 Peoples R China;
Chinese Univ Hong Kong Dept Informat Engn Shatin Hong Kong Peoples R China;
Swiss Fed Inst Technol Comp Vis Lab CH-8092 Zurich Switzerland;
Action recognition; temporal segment networks; temporal modeling; good practices; ConvNets;
机译:统一的时空注意力网络,用于视频中的动作识别
机译:基于注意力的时空分层ConvLSTM网络,用于视频中的动作识别
机译:水产养殖中水下视频的三文鱼饲养行动识别时空复发网络
机译:具有时间段融合的视频中的动作识别
机译:利用具有深度神经网络的分层和时间对象性的视频中的对象识别。
机译:Segment-Tube:具有按帧分割的未修剪视频中的时空行为本地化
机译:视频中动作识别的时间段网络
机译:利用线性时态逻辑的诱导推理对监控视频中的人体行为识别。