首页> 中国专利> 一种极度条件下的视听联合人群计数方法

一种极度条件下的视听联合人群计数方法

摘要

本发明公开了一种极度条件下的视听联合人群计数方法,包括步骤:S100,提取视觉特征,在给定的RGB图像上提取得到所述视觉特征vfeat;S200,提取音频特性,在给定的原始音频信号进行采样,然后进行短时傅立叶变换(STFT),以生成视频图,再应用Mel滤波器提取音频特征αfeat;S300,融合视听特征,基于提取的所述音频特征和所述视觉特性两个特征方向参数γ和β以分别在乘法和加法方面对这种交叉模态产生建模,公式如下所示:其中表示l个特征融合块,定义了第l个空洞卷积层,Fl和⊙分别是激活函数和逐元素相乘。与仅采用视觉信息的传统方法相比,在低质量图像的情况下,通过听觉感知场景的网络也能够估计人数,从而使计算得到的人数更加准确。

著录项

  • 公开/公告号CN113609930A

    专利类型发明专利

  • 公开/公告日2021-11-05

    原文格式PDF

  • 申请/专利权人 广东蓝鲲海洋科技有限公司;

    申请/专利号CN202110816701.2

  • 发明设计人 莫敏玲;

    申请日2021-07-20

  • 分类号G06K9/00(20060101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构

  • 代理人

  • 地址 519000 广东省珠海市横琴新区宝华路6号105室

  • 入库时间 2023-06-19 13:09:01

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号