首页> 中国专利> 基于多通道自编码器的多模态词汇表示方法与系统

基于多通道自编码器的多模态词汇表示方法与系统

摘要

本发明涉及自然语言处理领域,具体涉及一种基于多通道自编码器的多模态词汇表示方法与系统,目的在于提高表示结果的准确性。本发明的词汇表示方法,先通过向量数据库查询待表示词汇的文本模态向量、视觉模态向量、音频模态向量;对于没有视觉模态和音频模态的词汇,利用训练好的映射模型去预测缺失的视觉向量以及听觉向量;再计算上述三种向量与对应模态权重的点积;最后将上述加权后的向量作为多通道自编码器模型的输入,对三种模态的信息进行融合,得到多模态的词汇表示向量。本发明利用不同模态间的相关性,融合不同模态的信息,并引入模态权重,有效提高了词汇表示的准确度。为了对不同模态进行更好的融合,还加入了联想词汇预测模块。

著录项

  • 公开/公告号CN108536735B

    专利类型发明专利

  • 公开/公告日2020-12-15

    原文格式PDF

  • 申请/专利权人 中国科学院自动化研究所;

    申请/专利号CN201810178559.1

  • 发明设计人 王少楠;张家俊;宗成庆;

    申请日2018-03-05

  • 分类号G06F16/9032(20190101);G06F40/30(20200101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构11576 北京市恒有知识产权代理事务所(普通合伙);

  • 代理人郭文浩

  • 地址 100190 北京市海淀区中关村东路95号

  • 入库时间 2022-08-23 11:25:09

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号