机译:基于大规模数据的音频场景分类
Department of Information Technology, Annamalai University;
Department of Computer Science and Engineering, Annamalai University;
Big data analytics; Machine learning; Apache spark MLlib; Audio processing; Audio scene analysis; Audio scene classification; Deep learning; Audio features;
机译:有关用于场景切换检测的MPEG音频数据分类的注释
机译:有关用于场景切换检测的MPEG音频数据分类的注释
机译:有关用于场景切换检测的MPEG音频数据分类的注释
机译:使用多尺度密集连接卷积神经网络进行音频场景分类的样本丢失
机译:场景理解的神经模型:场景搜索,学习和识别中多尺度基于空间和基于特征的注意力。
机译:自然场景和场景分类中局部特征的多尺度空间级联
机译:利用并行录音以强制基于CNN的声学场景分类中的设备不变性