机译:调查多模式场景感知对话框的主题,音频表示和注意力
Anticipatory Computing Lab Intel Labs United States;
Anticipatory Computing Lab Intel Labs United States;
Anticipatory Computing Lab Intel Labs United States;
Anticipatory Computing Lab Intel Labs United States;
Anticipatory Computing Lab Intel Labs United States;
Al; Intelligent assistants; Multimodal understanding; Response generation;
机译:端到端视听场景感知对话响应生成的分层多模式关注
机译:通过深度声学分析的场景感知音频渲染
机译:360°视频的场景感知音频
机译:使用基于多模式注意力的视频功能的端到端视听场景感知对话框
机译:视觉问题应答的自下而上关注模型和多式联表学习分析
机译:通过选择性地关注视听对话来调制脑活动
机译:使用基于多模式关注的视频功能的端到端音频视觉场景感知对话框
机译:复杂多模双显双重任务中音频提示对注意转移影响的认知模型