机译:AudioBIFS:使用MPEG-4多媒体标准描述音频场景
机译:视听语音场景分析框架中的视听与竞争源集成
机译:显着性最大化的音频可视化和高效的视听浏览,可实现比实时人类声音事件检测更快的速度
机译:视听虚拟环境:通过场景图简化实现早期反射的实时渲染
机译:使用实时视听音高训练转移Suprase段改进的新句子和分段精度
机译:不听觉语音没有150 ms的视觉语音导联但是视听异步范围从小音频导联到大音频滞后
机译:对话头中3D视听渲染和表达的实时交互式控制
机译:用于音频场景分析的基于视觉的音频纹理分割。