首页> 中国专利> 基于文本识别的要素信息提取方法、装置、设备及介质

基于文本识别的要素信息提取方法、装置、设备及介质

摘要

本发明公开了基于文本识别的要素信息提取方法、装置、设备及介质,方法包括:对初始文档进行分页识别以获取文档信息页,根据初始文本识别模型从文档信息页中获取初始文本信息,若文档信息页中包含未识别文档内容,根据手写体识别模型对未识别内容进行识别得到手写体文本信息,根据文本纠错模型对初始文本信息及手写体文本信息进行文本纠错处理得到纠错文本信息并根据要素提取规则从中提取文本要素信息。本发明属于文本识别技术领域,通过初始文本识别模型及手写体识别模型相结合进行文本识别得到文本信息,进行文本纠错处理后提取文本要素信息,大幅提升了进行文本要素信息提取的灵活性,基于文本纠错处理可大幅提高获取文本要素信息的准确性。

著录项

  • 公开/公告号CN113536771A

    专利类型发明专利

  • 公开/公告日2021-10-22

    原文格式PDF

  • 申请/专利号CN202111094018.9

  • 发明设计人 杨东泉;程佳宇;王天星;钱启;

    申请日2021-09-17

  • 分类号G06F40/205(20200101);G06F40/126(20200101);G06F40/242(20200101);G06K9/32(20060101);G06K9/34(20060101);

  • 代理机构44242 深圳市精英专利事务所;

  • 代理人涂年影

  • 地址 518000 广东省深圳市前海深港合作区前湾一路1号A栋201室

  • 入库时间 2023-06-19 12:57:44

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号