首页> 中国专利> 一种图片中局部信息精准抓取的方法和系统

一种图片中局部信息精准抓取的方法和系统

摘要

本发明公开一种图片中局部信息精准抓取的方法。所述方法包括通过激光器在图片中需要抓取的信息周边形成一选择框;对具有选择框的图片进行拍摄,形成照片后存储至拍摄工具内;在拍摄工具内对图片进行识别,识别出选择框后沿着选择框对图片进行裁剪、二值化处理,便于原图打印。本发明采用激光辅助,在需要采集的信息周边形成选择框,再通过软件对选择框范围进行识别,将选择框外的信息忽略,只识别选择框内的信息,同时,将识别的信息与题库内容进行比对,比对成功即可自动对错题归类整理,大大提高了错题的收集效率。本发明还公开了一种图片中局部信息精准抓取的系统。

著录项

  • 公开/公告号CN112488110A

    专利类型发明专利

  • 公开/公告日2021-03-12

    原文格式PDF

  • 申请/专利权人 深圳简捷电子科技有限公司;

    申请/专利号CN202011500131.8

  • 发明设计人 王武帅;

    申请日2020-12-18

  • 分类号G06K9/32(20060101);G06K9/34(20060101);G06K9/46(20060101);G06T7/13(20170101);G06T7/136(20170101);

  • 代理机构44611 深圳市广诺专利代理事务所(普通合伙);

  • 代理人伍华荣

  • 地址 518000 广东省深圳市龙岗区布吉街道布吉圩社区吉华路69号中心广场B座办公15B-4

  • 入库时间 2023-06-19 10:11:51

说明书

【技术领域】

本发明涉及图片信息抓取技术领域,尤其涉及一种图片中局部信息精准抓取的方法和系统。

【背景技术】

错题本是现在学生学习过程中非常重要的一个工具,现在学校里面学生收集错题一般都是通过裁剪、摘抄等模式进行收集,还有一些都是采用高拍仪、带屏幕的设备如手机、相机来进行错题的收集。

但是上述收集方式都相当麻烦,如学生用手机收集时,往往会因为自制力不够而导致沉迷手机游戏。

而且,在用手机拍照的时候,往往会对错题周边的文字也一起拍摄到了,需要在屏幕上多个步骤才能实现对内容的裁剪、打印,操作就相当麻烦。

鉴于此,实有必要提供一种图片中局部信息精准抓取的方法和系统以克服上述缺陷。

【发明内容】

本发明的目的是提供一种图片中局部信息精准抓取的方法和系统,旨在改善现有技术中存在的问题。

为了实现上述目的,本发明一方面是提供一种图片中局部信息精准抓取的方法,所述方法包括:

步骤S11、通过激光器在图片中需要抓取的信息周边形成一选择框;

步骤S12、对具有选择框的图片进行拍摄,形成照片后存储至拍摄工具内;

步骤S13、在拍摄工具内对图片进行识别,识别出选择框后沿着选择框对图片进行裁剪;

步骤14、将裁剪完成的图片信息进行识别。

在一些实施例中,所述步骤S14之后还包括:

步骤S15、将识别的信息在题库内进行匹配,找到最匹配的信息后,将该信息确定为需要抓取的信息。

在一些实施例中,所述步骤S13之后还包括:

S17、对裁剪后的图片进行二值化处理。

在一些实施例中,所述步骤S11之后还包括:

步骤S16、通过辅助工具对选择框的大小进行缩减。

在一些实施例中,所述辅助工具为尺子或手指。

在一些实施例中,所述选择框的大小通过控制拍摄工具和图片之间的距离来改变。

在一些实施例中,激光器设置在拍摄工具上。

本发明还提出了一种图片中局部信息精准抓取的系统,所述系统包括:

拍摄工具,所述拍摄工具上还设有一激光器,所述激光器用于在图片中需要抓取的信息周边形成一选择框,所述拍摄工具用于拍摄图片的照片;

存储模块,所述存储模块用于照片的存储;

选择框识别模块,所述选择框识别模块用于选择框的识别;

裁剪模块,所述裁剪模块用于沿着选择框对图片进行裁剪;

二值化处理模块,所述二值化处理模块用于对裁剪后的图片进行处理;以及OCR识别模块,所述OCR识别模块对图片中的信息进行识别。

在一些实施例中,所述系统还包括:

比对模块,所述比对模块用于将识别的图片信息与题库内的信息进行比对。

在一些实施例中,所述系统还包括:

辅助工具识别模块,所述辅助工具识别模块用于辅助工具的识别。

本发明采用激光辅助,在需要采集的信息周边形成选择框,再通过软件对选择框进行识别,将选择框外的信息忽略,只识别选择框内的信息,同时,将识别的信息与题库内的题目进行比对,比对成功即可对改错题进行打印,大大提高了错题的收集效率。

【附图说明】

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本发明较佳实施例一种图片中局部信息精准抓取的方法的流程图。

图2为本发明较佳实施例一种图片中局部信息精准抓取的系统的原理框图。

【具体实施方式】

为了使本发明的目的、技术方案和有益技术效果更加清晰明白,以下结合附图和具体实施方式,对本发明进行进一步详细说明。应当理解的是,本说明书中描述的具体实施方式仅仅是为了解释本发明,并不是为了限定本发明。

还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。

在本发明的实施例中,一方面是提供一种图片中局部信息精准抓取的方法,所述方法包括:

步骤S11、通过激光器在图片中需要抓取的信息周边形成一选择框;

步骤S12、对具有选择框的图片进行拍摄,形成照片后存储至拍摄工具内;

步骤S13、在拍摄工具内对图片进行识别,识别出选择框后沿着选择框对图片进行裁剪;

步骤14、将裁剪完成的图片信息进行识别。

具体地,当需要收集错题时,首先通过激光器在错题周边形成一选择框,该选择框的形状可以为长方形或正方形,选择完成后,通过拍摄工具进行拍照,拍完的照片对选择框进行识别,将选择框外多余的部分进行裁剪,最终获得选择框内的内容,即错题信息,再将错题信息通过OCR识别,即可获得需要的信息。

在一些实施例中,所述步骤S14之后还包括:

步骤S15、将识别的信息在题库内进行匹配,找到最匹配的信息后,将该信息确定为需要抓取的信息。

具体地,本方案还需题库相连接,将OCR处理后的信息,与题库内的题目进行比对,得到该错题的原始题目,直接对该原始的题目进行打印。

在一些实施例中,所述步骤S13之后还包括:

S17、对裁剪后的图片进行二值化处理。

具体地,进行二值化处理后,将原本拍照的图片的颜色转化成黑白,方便打印。

需要说明的是,图像的二值化处理就是将图像上的点的灰度值为0或255,也就是将整个图像呈现出明显的黑白效果。即将256个亮度等级的灰度图像通过适当的阈值选取而获得仍然可以反映图像整体和局部特征的二值化图像。在数字图像处理中,二值图像占有非常重要的地位,特别是在实用的图像处理中,以二值图像处理实现而构成的系统是很多的,要进行二值图像的处理与分析,首先要把灰度图像二值化,得到二值化图像,这样子有利于在对图像做进一步处理时,图像的集合性质只与像素值为0或255的点的位置有关,不再涉及像素的多级值,使处理变得简单,而且数据的处理和压缩量小。为了得到理想的二值图像,一般采用封闭、连通的边界定义不交叠的区域。所有灰度大于或等于阈值的像素被判定为属于特定物体,其灰度值为255表示,否则这些像素点被排除在物体区域以外,灰度值为0,表示背景或者例外的物体区域。

如果某特定物体在内部有均匀一致的灰度值,并且其处在一个具有其他等级灰度值的均匀背景下,使用阈值法就可以得到比较的分割效果。如果物体同背景的差别表现不在灰度值上(比如纹理不同),可以将这个差别特征转换为灰度的差别,然后利用阈值选取技术来分割该图像。动态调节阈值实现图像的二值化可动态观察其分割图像的具体结果。

在一些实施例中,所述步骤S11之后还包括:

步骤S16、通过辅助工具对选择框的大小进行缩减。

在一些实施例中,所述辅助工具为尺子或手指。

具体地,虽然激光器发出的选择框的大小可以通过调节拍摄工具和图片之间的距离进行等比例的放大或缩小,但是不可能每次正好将错题框起来,有些时候,长度跟错题一样,但是宽度或大或小,本方案还可以增加辅助工具来进行二次定位,该辅助工具可以为尺子,也可以为手指。

当拍摄的图片中有选择框,还存在辅助工具时,此时,我们裁剪的时候先沿着选择框进行一次裁剪,再沿着辅助工具进行二次裁剪,使得裁剪后的图片内正好是错题的内容。

在一些实施例中,所述选择框的大小通过控制拍摄工具和图片之间的距离来改变。

在一些实施例中,激光器设置在拍摄工具上。

本发明还提供了一种图片中局部信息精准抓取的系统,所述系统包括:

拍摄工具,所述拍摄工具上还设有一激光器10,所述激光器用于在图片中需要抓取的信息周边形成一选择框,所述拍摄工具用于拍摄图片的照片;

存储模块20,所述存储模块用于照片的存储;

选择框识别模块30,所述选择框识别模块用于选择框的识别;

裁剪模块40,所述裁剪模块用于沿着选择框对图片进行裁剪;

二值化处理模块50,所述二值化处理模块用于对裁剪后的图片进行处理;以及

OCR识别模块60,所述OCR识别模块对图片中的信息进行识别。

在一些实施例中,所述系统还包括:

比对模块70,所述比对模块用于将识别的图片信息与题库内的信息进行比对。

在一些实施例中,所述系统还包括:

辅助工具识别模块80,所述辅助工具识别模块用于辅助工具的识别。

本发明采用激光辅助,在需要采集的信息周边形成选择框,再通过软件对选择框进行识别,将选择框外的信息忽略,只识别选择框内的信息,同时,将识别的信息与题库内的题目进行比对,比对成功即可对改错题进行打印,大大提高了错题的收集效率。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

在本发明所提供的实施例中,应该理解到,所揭露的系统或装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的系统或装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

本发明并不仅仅限于说明书和实施方式中所描述,因此对于熟悉领域的人员而言可容易地实现另外的优点和修改,故在不背离权利要求及等同范围所限定的一般概念的精神和范围的情况下,本发明并不限于特定的细节、代表性的设备和这里示出与描述的图示示例。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号