首页> 中国专利> 基于多通道自编码器的多模态词汇表示方法与系统

基于多通道自编码器的多模态词汇表示方法与系统

页面导航

摘要
著录项
相似文献

摘要

本发明涉及自然语言处理领域，具体涉及一种基于多通道自编码器的多模态词汇表示方法与系统，目的在于提高表示结果的准确性。本发明的词汇表示方法，先通过向量数据库查询待表示词汇的文本模态向量、视觉模态向量、音频模态向量；对于没有视觉模态和音频模态的词汇，利用训练好的映射模型去预测缺失的视觉向量以及听觉向量；再计算上述三种向量与对应模态权重的点积；最后将上述加权后的向量作为多通道自编码器模型的输入，对三种模态的信息进行融合，得到多模态的词汇表示向量。本发明利用不同模态间的相关性，融合不同模态的信息，并引入模态权重，有效提高了词汇表示的准确度。为了对不同模态进行更好的融合，还加入了联想词汇预测模块。

著录项

公开/公告号CN108536735B

专利类型发明专利
公开/公告日2020-12-15

原文格式PDF
申请/专利权人中国科学院自动化研究所;
展开▼

申请/专利号CN201810178559.1
发明设计人王少楠;张家俊;宗成庆;
展开▼

申请日2018-03-05
分类号G06F16/9032(20190101);G06F40/30(20200101);G06N3/04(20060101);G06N3/08(20060101);
代理机构11576 北京市恒有知识产权代理事务所(普通合伙);
代理人郭文浩
地址 100190 北京市海淀区中关村东路95号
入库时间 2022-08-23 11:25:09

相似文献

专利
中文文献
外文文献

1. 基于多通道自编码器的多模态词汇表示方法与系统 [P] . 中国专利： CN108536735B . 2020.12.15
2. 基于多通道自编码器的多模态词汇表示方法与系统 [P] . 中国专利： CN108536735A . 2018-09-14
3. DEVICE FOR PROVIDING UPMIX SIGNAL REPRESENTATION BASED ON DOWNMIX SIGNAL REPRESENTATION, DEVICE FOR PROVIDING BITSTREAM REPRESENTING MULTICHANNEL AUDIO SIGNAL, METHODS, COMPUTER PROGRAMS AND BITSTREAM REPRESENTING MULTICHANNEL AUDIO SIGNAL USING LINEAR COMBINATION PARAMETER [P] . 俄罗斯专利： RU2607267C2 . 2017-01-10

机译：基于DOWNMIX信号表示提供UPMIX信号表示的设备，提供比特流表示多通道音频信号的设备，方法，计算机程序和比特流表示多通道音频信号组合使用
4. APPARATUS FOR PROVIDING AN UPMIX SIGNAL REPRESENTATION ON THE BASIS OF THE DOWNMIX SIGNAL REPRESENTATION, APPARATUS FOR PROVIDING A BITSTREAM REPRESENTING A MULTI-CHANNEL AUDIO SIGNAL, METHODS, COMPUTER PROGRAMS AND BITSTREAM REPRESENTING A MILTI-CHANNEL AUDIO SIGNAL USING A LINEAR COMBINATION PARAMETER [P] . 韩国专利： KR20120084314A . 2012-07-27

机译：基于DownMIX信号表示来提供UPMIX信号表示的设备，用于提供比特流表示多通道音频信号的设备，方法，计算机程序和比特流表示表示美式报价的方法
5. METHOD AND APPARATUS FOR QUERY EXPANSION BASED ON MULTIMODAL CROSS-VOCABULARY MAPPING [P] . 美国专利： US2008250011A1 . 2008-10-09

机译：基于多模态交叉词汇映射的查询扩展方法和装置