首页> 中国专利> 端到端的文本识别模型训练方法、文本识别方法及装置

端到端的文本识别模型训练方法、文本识别方法及装置

页面导航

摘要
著录项
法律信息
相似文献

摘要

本申请公开了一种端到端的文本识别模型训练方法及装置，将目标文本行图像输入特征提取模块，获取目标输入特征向量。将目标输入特征向量和目标字符位置向量输入特征编码器，获得第一特征向量。对第一特征向量进行重复操作，获取第二特征向量。基于目标文本行图像对应的标签，获取目标输出特征向量。将第二特征向量、目标输出特征向量以及目标字符位置向量输入特征解码器，获得目标文本行图像的预测概率分布结果。由图像对应的标签和预测概率分布结果，获取损失值，基于损失值训练模型。目标输出特征向量由图像中每个字符的真实位置向量和真实文本内容向量拼接组成。训练完成的模型可同时预测字符的字符位置和文本内容，可提高文本识别的效率。

著录项

公开/公告号CN115082937A

专利类型发明专利
公开/公告日2022-09-20

原文格式PDF
申请/专利权人抖音视界(北京)有限公司;
展开▼

申请/专利号CN202210704167.0
发明设计人张宇轩;林丽;黄灿;
展开▼

申请日2022-06-21
分类号G06V30/19;G06V30/18;
代理机构北京信远达知识产权代理有限公司;
代理人储倩
地址 100041 北京市石景山区实兴大街30号院3号楼2层B-0035房间
入库时间 2023-06-19 16:54:51

法律信息

法律状态公告日

法律状态信息

法律状态
2022-09-20

公开

发明专利申请公布

相似文献

专利
中文文献
外文文献

1. 端到端文本识别方法、模型训练方法及装置 [P] . 中国专利： CN112861739B . 2022.09.09
2. 端到端文本识别方法、模型训练方法及装置 [P] . 中国专利： CN112861739A . 2021-05-28
3. HANDWRITING MODEL TRAINING METHOD AND APPARATUS, TEXT RECOGNITION METHOD AND APPARATUS, AND DEVICE AND MEDIUM [P] . 世界知识产权组织专利： WO2019232861A1 . 2019-12-12

机译：手势模型训练方法和装置，文本识别方法和装置以及装置和介质
4. HANDWRITING MODEL TRAINING METHOD, TEXT RECOGNITION METHOD AND APPARATUS, DEVICE, AND MEDIUM [P] . 世界知识产权组织专利： WO2019232869A1 . 2019-12-12

机译：手写模型训练方法，文本识别方法以及装置，装置和介质
5. End-to-end text recognition method and apparatus, computer device and readable medium [P] . 美国专利： US11210546B2 . 2021-12-28

机译：端到端文本识别方法和设备，计算机设备和可读介质