首页> 中国专利> 一种基于图像识别的自动化保险条款解析方法

一种基于图像识别的自动化保险条款解析方法

摘要

本发明提供了一种基于图像识别的自动化保险条款解析方法,包括:第一步骤:将PDF保险条款文本逐页拆分并转化成图片格式;第二步骤:利用DB文本检测算法进行文本检测,并得到相应的文本框坐标;第三步骤:针对得到的文本框坐标,利用文本方向分类器进行检测框矫正,基于测试文本数据优化检测框框选的准确度;第四步骤:利用文本框之间的间距,将无用数据进行删除,以得到可用文本框;第五步骤:将所需的可用文本框识别成可读的文本数据;第六步骤:利用文本框的坐标对可读的文本数据进行匹配,得到结构化数据。

著录项

  • 公开/公告号CN114330247A

    专利类型发明专利

  • 公开/公告日2022-04-12

    原文格式PDF

  • 申请/专利权人 世纪保众(北京)网络科技有限公司;

    申请/专利号CN202111322617.1

  • 发明设计人 李红丽;田立文;刘宇;张大栋;

    申请日2021-11-09

  • 分类号G06F40/151(20200101);G06V20/62(20220101);G06V10/764(20220101);G06V10/82(20220101);G06K9/62(20220101);G06N3/04(20060101);G06N3/08(20060101);G06T3/00(20060101);G06Q40/08(20120101);

  • 代理机构11544 北京金蓄专利代理有限公司;

  • 代理人姚金良

  • 地址 100176 北京市大兴区经济技术开发区荣华南路15号院5号楼12层1202室

  • 入库时间 2023-06-19 14:51:31

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-04-12

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号