Multimodal signal processing; Machine learning applications; Music transcription; Percussion music; Sound classification;
机译:使用音频到音频对齐来同步多模式录音声学指纹识别在促进音乐交互研究中的应用
机译:具有高视听通信的视频的多峰显着性模型
机译:基于视听功能的多模式框架,用于板球视频摘要
机译:打击乐从音频和视频转录的多峰方法
机译:自动音乐转录和音频信号分解的迭代方法。
机译:基于深度学习的音乐视频的多模式情感分类
机译:比较音乐视频索引的音频和视频分段