首页> 中文期刊>计算机研究与发展 >基于全局-时频注意力网络的语音伪造检测

基于全局-时频注意力网络的语音伪造检测

     

摘要

语音伪造检测是近年的一个研究热点,受到了广泛关注.目前,卷积神经网及其变种的提出,使其在语音伪造检测任务中取得了不错进展.然而,目前仍存在2方面问题:1)当前工作假设送入卷积神经网络的特征图的每一维对结果的影响是相同的,忽视了每一维上特征图的不同位置强调的信息是不一样的.2)此外,前人工作大多关注特征图的局部信息,没有利用全局视图中特征图之间的关系.为了解决以上挑战,引入全局-时频注意力框架,分别对通道维度和时频维度做了注意力变换.具体而言,引入了 2个并行的注意力模块:1)时频注意力模块;2)全局注意力模块.对于时频注意力模块,可以通过使用加权求和在所有时频特征图上聚合特征来进行更新.对于全局注意力模块,借鉴了 SE-Net的思想,通过参数为每个特征通道生成权重.通过这种办法,可以得到特征通道上响应的全局分布.在ASVspoof2019 LA公开数据集上进行了一系列实验,结果显示所提的模型取得不错的效果,最佳模型的等错误率达到4.12%,刷新了单个模型的最好成绩.

著录项

  • 来源
    《计算机研究与发展》|2021年第7期|1466-1475|共10页
  • 作者单位

    中国科学技术大学信息科学技术学院 合肥 230027;

    模式识别国家重点实验室(中国科学院自动化研究所) 北京 100080;

    模式识别国家重点实验室(中国科学院自动化研究所) 北京 100080;

    模式识别国家重点实验室(中国科学院自动化研究所) 北京 100080;

    中国科学院大学人工智能学院 北京 100049;

    模式识别国家重点实验室(中国科学院自动化研究所) 北京 100080;

    模式识别国家重点实验室(中国科学院自动化研究所) 北京 100080;

    模式识别国家重点实验室(中国科学院自动化研究所) 北京 100080;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 安全保密;语音信号处理;
  • 关键词

    语音鉴伪; 注意力机制; 语音伪造检测; 全局注意力; 时频注意力;

  • 入库时间 2023-07-25 09:27:42

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号