首页> 中国专利> 一种基于多重注意力视听融合的音频立体化方法

一种基于多重注意力视听融合的音频立体化方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种基于多重注意力视听融合的音频立体化方法，属于多媒体信号处理领域，该方法设计了能实现对视觉特征与音频特征进行有效跨模态融合的视听注意力融合模块，并在此基础上设计了多重注意力融合模型，能将原始视觉特征张量中与声源空间信息高度相关的特征提取出来并注入到多个不同等级的音频特征中，从而赋予了单声道音频以空间信息，将其转化为立体声信号。

著录项

公开/公告号CN113099374A

专利类型发明专利
公开/公告日2021-07-09

原文格式PDF
申请/专利权人四川省人工智能研究院(宜宾);
展开▼

申请/专利号CN202110340463.2
发明设计人邵杰;张文;
展开▼

申请日2021-03-30
分类号H04S1/00(20060101);H04S7/00(20060101);G06N3/04(20060101);G06K9/62(20060101);G06K9/00(20060101);G06F17/14(20060101);
代理机构51229 成都正华专利代理事务所(普通合伙);
代理人李蕊
地址 644000 四川省宜宾市临港经济技术开发区长江北路西段附二段430号
入库时间 2023-06-19 11:45:49

法律信息

法律状态公告日

法律状态信息

法律状态
2022-08-05

授权

发明专利权授予

相似文献

专利
中文文献
外文文献

1. 一种基于多重注意力视听融合的音频立体化方法 [P] . 中国专利： CN113099374A . 2021-07-09
2. 多重注意力幽灵残差融合分类模型及其分类方法 [P] . 中国专利： CN113052254A . 2021-06-29
3. AUDIOVISUAL MEDIA APPLICATION PLATFORM, WIRELESS HANDHELD AUDIO CAPTURE DEVICE AND MULTI-VOCALIST METHODS THEREFOR [P] . 世界知识产权组织专利： WO2017075497A1 . 2017-05-04

机译：视听媒体应用平台，无线手持音频捕获设备及其多重声音方法
4. Apparatus and method for construction of the storage, for the recovery and for the utilization of data, and, in particular, on memory - supported a method for carrying out of a virtually - simultaneous reproduction of audio effect data in synchronism with the reproduction of video data associated therewith in a system for audio - visual effects [P] . 德国专利： DE19882539T1 . 2000-07-06

机译：用于存储装置的构造，用于数据的恢复和利用并且尤其是在存储器上的装置和方法，支持一种用于与音频的再现同步地虚拟地同时再现音频效果数据的方法视听效果系统中与之关联的数据
5. MULTIPLE ANALYSIS METHOD FOR AMPLICON BY USING FLUORESCENCE-BASED MULTIPLE MELTING ANALYSIS [P] . 世界知识产权组织专利： WO2020067599A1 . 2020-04-02

机译：基于荧光的多重融合分析的扩增子多重分析方法