机译:媒体场景学习:一种新颖的框架,可从音频和视频信号中自动提取有意义的部分
机译:基于上下文教学的视频视听停止运动的学习媒体的发展与科学学习水循环材料
机译:用于环境音频场景和声音事件识别的混合框架中的生成模型驱动表示学习
机译:SegChainW2V:建立一个基于音频转录和词嵌入的词法链的通用自动视频分割框架
机译:使用自动提取的音频进行视频检索
机译:视频,音频片段和文本材料:对心理学学习中媒体使用的调查。
机译:通过自动识别有意义的图像实现机器人中的鲁棒快速场景识别
机译:使用自动提取的音频摘录增强视频浏览功能
机译:用于改变照明水平场景的视频信号的自动增益控制电路