Columbia Univ, New York, NY 10027 USA;
Adobe Res, Seattle, WA USA;
Columbia Univ, New York, NY 10027 USA;
360 degrees videos; ambisonic audio;
机译:360度视频中的视听对象删除
机译:端到端视听场景感知对话响应生成的分层多模式关注
机译:调查多模式场景感知对话框的主题,音频表示和注意力
机译:使用基于多模式注意力的视频功能的端到端视听场景感知对话框
机译:提高HTTP自适应视频流的体验质量:从遗留到360°视频
机译:使用360°视频研究执行功能的简单有效方法
机译:使用基于多模式关注的视频功能的端到端音频视觉场景感知对话框