首页> 中国专利> 印刷体阿拉伯字符集文本切分方法

印刷体阿拉伯字符集文本切分方法

摘要

印刷体阿拉伯字符集文本切分方法属于光学字符识别中的字符切分领域。本发明特征在于:在字符块分类的基础上,选择部分字符块水平投影分割文本图像成子区域,然后检测多行子区域归并字符块实现多行子区域的文字行切分;随后估计文字行的基线和顶线位置,并把文字行切分成联体字符段;最后根据字符切点的特点寻找在基线上、基线上方及基线下方的切点,并且利用结构规则删除过切分点。本发明在多字体多字号印刷体阿拉伯文本测试集上的字符切分正确率达到99%以上。

著录项

  • 公开/公告号CN1332348C

    专利类型发明授权

  • 公开/公告日2007-08-15

    原文格式PDF

  • 申请/专利权人 清华大学;

    申请/专利号CN200510086478.1

  • 申请日2005-09-23

  • 分类号G06K9/00(20060101);

  • 代理机构

  • 代理人

  • 地址 100084 北京市100084-82信箱

  • 入库时间 2022-08-23 08:59:34

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-09-10

    未缴年费专利权终止 IPC(主分类):G06K 9/00 授权公告日:20070815 终止日期:20180923 申请日:20050923

    专利权的终止

  • 2007-08-15

    授权

    授权

  • 2007-08-15

    授权

    授权

  • 2006-04-26

    实质审查的生效

    实质审查的生效

  • 2006-04-26

    实质审查的生效

    实质审查的生效

  • 2006-03-01

    公开

    公开

  • 2006-03-01

    公开

    公开

查看全部

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号