首页> 中国专利> 基于高斯约束注意力机制网络的场景文字识别方法及系统

基于高斯约束注意力机制网络的场景文字识别方法及系统

摘要

本发明提出一种基于高斯约束注意力机制网络的场景文字识别方法及系统,涉及图像信息识别领域,通过提取待识别图片的视觉特征,得到二维特征图;将二维特征图转化为一维特征序列,根据该一维特征序列提取全局语义信息;将全局语义信息输入至第一个时间步中初始化解码隐状态,并在每个时间步中根据隐状态和二维特征图计算原始的注意力权重,利用该权重加权求和得到原始加权特征向量;根据隐状态和原始加权特征向量构造二维高斯分布掩膜,将该掩膜与原始的注意力权重相乘,得到矫正的注意力权重,根据该权重得到矫正后加权特征向量;将原始加权特征向量和矫正后加权特征向量融合一起来预测待识别图片的字符,从而能够解决注意力弥散的情况。

著录项

  • 公开/公告号CN112070114A

    专利类型发明专利

  • 公开/公告日2020-12-11

    原文格式PDF

  • 申请/专利权人 中国科学院信息工程研究所;

    申请/专利号CN202010767079.6

  • 发明设计人 王伟平;乔峙;秦绪功;周宇;

    申请日2020-08-03

  • 分类号G06K9/62(20060101);G06F40/30(20200101);G06N3/04(20060101);

  • 代理机构11200 北京君尚知识产权代理有限公司;

  • 代理人李文涛

  • 地址 100093 北京市海淀区闵庄路甲89号

  • 入库时间 2023-06-19 08:04:59

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-05-16

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号