首页> 中国专利> 基于语义强化编码器解码器框架的场景文字识别方法及系统

基于语义强化编码器解码器框架的场景文字识别方法及系统

页面导航

摘要
著录项
相似文献

摘要

本发明提供一种基于语义强化编码器解码器框架的场景文字识别方法及系统，将目标图像上的任意形状的文本矫正为水平文本，得到矫正后的图像；将矫正后的图像输入到卷积神经网络中提取视觉特征，利用循环神经网络从该视觉特征中提取序列信息；根据序列信息预测全局语义信息；利用上述全局语义信息初始化一基于注意力机制的门控循环单元GRU的状态，根据上述视觉特征与GRU每一个解码时间的隐状态计算注意力权重，根据该注意力权重对上述视觉特征进行加权，预测出图像上的每一个字符。能够有效地利用全局信息填补现有方法使用局部信息的不足，同时减小视觉信息与语义信息之间的鸿沟，从而使模型能够更好地处理低质量的图像。

著录项

公开/公告号CN111753827A

专利类型发明专利
公开/公告日2020-10-09

原文格式PDF
申请/专利权人中国科学院信息工程研究所;
展开▼

申请/专利号CN202010416704.2
发明设计人王伟平;乔峙;周宇;杨东宝;周玉灿;
展开▼

申请日2020-05-15
分类号G06K9/32(20060101);G06K9/40(20060101);G06N3/04(20060101);
代理机构11200 北京君尚知识产权代理有限公司;
代理人陈艳
地址 100093 北京市海淀区闵庄路甲89号
入库时间 2023-06-19 08:30:12

相似文献

专利
中文文献
外文文献

1. 基于语义强化编码器解码器框架的场景文字识别方法及系统 [P] . 中国专利： CN111753827A . 2020-10-09
2. 一种基于语义笔画池化的场景文字识别方法 [P] . 中国专利： CN107273863A . 2017-10-20
3. Acoustic scene encoder, acoustic scene decoder and method using hybrid encoder / decoder space analysis [P] . JP2021513108A . 2021-05-20

机译：声学场景编码器，声学场景解码器和使用混合编码器/解码器空间分析的方法
4. Audio scene encoder, audio scene decoder and related methods using hybrid encoder/decoder spatial analysis [P] . 韩国专利： KR20200116968A . 2020-10-13

机译：使用混合编码器/解码器空间分析的音频场景编码器，音频场景解码器和相关方法
5. AUDIO SCENE ENCODER, AUDIO SCENE DECODER AND RELATED METHODS USING HYBRID ENCODER/DECODER SPATIAL ANALYSIS [P] . SG11202007182UA . 2020-08-28

机译：使用混合编码器/解码器空间分析的音频场景编码器，音频场景解码器及相关方法