首页> 中国专利> 身份证明文件处理的方法和装置

身份证明文件处理的方法和装置

摘要

本文提供了身份证明文件处理的方法和装置,包括编码在计算机存储介质上的计算机程序。方法之一包括:从第一有效位置拍摄身份证明文件的第一图像,使得可从所述第一图像提取所述身份证明文件上的文本;从第二有效位置拍摄所述身份证明文件的第二图像,使得所述第二图像包括所述身份证明文件及其背景。所述方法还包括从所述第一图像提取所述身份证明文件上的文本;以及认证模块至少基于所述第二图像中的背景,对所述身份证明文件进行认证。

著录项

  • 公开/公告号CN112613346A

    专利类型发明专利

  • 公开/公告日2021-04-06

    原文格式PDF

  • 申请/专利权人 支付宝实验室(新加坡)有限公司;

    申请/专利号CN202011388942.3

  • 发明设计人 徐炎;

    申请日2020-12-01

  • 分类号G06K9/00(20060101);G06K9/20(20060101);G06K9/62(20060101);G06N3/08(20060101);

  • 代理机构11415 北京博思佳知识产权代理有限公司;

  • 代理人韩果

  • 地址 新加坡珊顿大道8号安盛大厦45-01号

  • 入库时间 2023-06-19 10:29:05

说明书

技术领域

本文一般性地而非唯一地涉及身份证明文件处理的方法和装置。

背景技术

在某些“电子化了解你的客户(eKYC)”处理中,要求客户提供政府认可的身份证明文件(ID)的图片来证明其身份。如今,可以使用移动设备来提供身份证明文件图片,例如通过使用移动电话的摄像头拍摄ID卡的图片。然后可以通过光学字符识别(OCR)从身份证明文件图片提取ID卡中的关键信息,例如,姓名、身份证明文件号和出生日期。除了从ID卡获取关键信息外,在处理身份证明文件图片时检查ID卡的真实性也很重要。例如,这是为了防止欺诈者提供的身份证明文件图片不是从他所拥有的物理ID卡中拍摄的,而是从ID卡的屏幕截图或纸张打印的身份证明文件副本中拍摄的。

在现有方法中,客户需要为eKYC处理拍摄仅一张身份证明文件图片。为了使OCR成功,客户可能会将相机放在ID卡附近,以拍摄清晰的近景图像。同时,几乎不拍摄ID卡周围的背景细节。但是,这样的背景信息有助于检查ID卡(即,物理卡而不是屏幕截图或纸张打印件)的真实性。虽然清晰的近景图像有助于通过OCR提取正确的信息,但是由于几乎不存在背景信息,因此难以对ID卡的真实性进行检查。因此,当在现有方法中使用从一个角度和一个距离拍摄的单个身份证明文件图片时,在平衡OCR功能和欺诈检测功能的准确性方面存在困难。

发明内容

描述的实施例提供了用于身份证明文件处理的方法和装置,包括提取身份证明文件上的文本并对身份证明文件进行认证。在一些实施例中,该方法请求用户从两个不同的距离拍摄其ID卡的两个图像以进行处理,例如,在“电子化了解你的客户(eKYC)”处理中。从较短距离拍摄的身份证明文件图像显示身份证明文件的关键信息的清晰图像,该图像用于通过光学字符识别(OCR)提取关键信息。从较长距离拍摄的身份证明文件图片包括ID卡周围的背景的细节,其有利地用于检查ID卡的真实性。在一些实施方式中,如果身份证明文件图像是从物理卡的屏幕截图中拍摄的,则背景可以包括屏幕的边界,这有助于对身份证明文件进行认证并确定其是非真实ID卡的图片。在一些实施方式中,对身份证明文件进行认证包括采用基于卷积神经网络(CNN)的二元分类器,该分类器可以在真实物理ID卡和非真实ID卡(例如ID卡的屏幕截图或ID卡的纸张打印件)的图像上训练。

根据一个实施例,提供了一种用于身份证明文件处理的方法。该方法包括:图像获取模块从第一有效位置拍摄身份证明文件的第一图像,使得能从所述第一图像提取所述身份证明文件上的文本;所述图像获取模块从第二有效位置拍摄所述身份证明文件的第二图像,使得所述第二图像包括所述身份证明文件及其背景;从所述第一图像提取所述身份证明文件上的文本;以及认证模块至少基于所述第二图像中的背景,对所述身份证明文件进行认证。

根据其他实施例,这些一般和特定实施例中的一个或多个可以使用装置来实现,该装置包括多个模块、系统、方法或计算机可读介质,或者设备、系统、方法和计算机可读介质的任意组合。前述和描述的其他实施例可以各自可选地包括以下实施例中的一些、全部或不包括以下实施例。

附图说明

实施例和实施方式仅以举例的方式提供,并且通过以下结合附图阅读的书面描述,本领域普通技术人员将更好地理解实施例,并且这些实施例将易于理解,其中:

图1是示出根据实施例的用于身份证明文件(ID)处理的方法的示例的流程图。

图2是示出根据实施例的使用图1中的用于身份证明文件处理的方法的示例性eKYC处理的流程图。

图3是根据一个实施例的从两个距离拍摄ID卡的图像的示例的示意图。

图4是根据实施例的用于身份证明文件处理的装置的模块的示例的示意图。

图5是根据实施例的适于执行图1和图2所示的示例性方法的至少一些步骤的计算机系统的示例的框图。

技术人员将理解,图中的元件被简单和清楚地示出,并且不一定按比例描绘。例如,相对于其他元件,可能夸大了图示、框图或流程图中的一些元件的尺寸,以帮助提高对本文实施例的理解。

具体实施方式

将仅以举例的方式参照附图描述了实施例。附图中相同的附图标记和字符表示相同的元件或等同物。

以下描述的某些部分是根据对计算机存储器内数据的操作的算法以及功能或符号表示来显式或隐式呈现的。这些算法描述以及功能或符号表示是数据处理领域技术人员用来最有效地向本领域其他技术人员传达其工作实质的手段。这里,算法通常被认为是导致所需结果的一系列自洽的步骤。这些步骤是需要对诸如能够存储、传输、组合、比较和以其他方式操纵的电信号、磁信号或光信号之类的物理量进行物理操纵的步骤。

除非另有特别说明,并且从下文中可以明显看出,否则将理解,在整个本文中,利用诸如“处理”、“比较”、“请求”、“指示”、“拍摄”、“认证”、“分类”、“接收”、“获得”、“训练”、“确定”、“计算”、“生成”、“检测”、“改变”、“执行”、“更新”、“提取”、“表示”、“检查”、“输出”等的术语,指的是计算机系统或类似电子设备的动作和处理,所述计算机系统或类似电子设备将计算机系统内的以物理量表示的数据操纵和转换为计算机系统或其他信息存储、传输或显示设备内的类似以物理量表示的其他数据。

本文还公开了用于执行所述方法的操作的装置。这样的装置可以被专门地构造用于所需的目的,或者可以包括计算机或由存储在计算机中的计算机程序选择性地激活或重新配置的其他设备。本文提出的算法和显示与任何特定计算机或其他装置没有固有的关联。根据本文的教导,各种机器可以与程序一起使用。可选地,用于执行所需方法步骤的更专用的装置的构造可能是合适的。适合于执行本文描述的各种方法/处理的计算机的结构将从下面的描述中显现。

另外,本文还隐含地公开了一种计算机程序,因为对于本领域技术人员而言清楚的是,本文所述方法的各个步骤可以通过计算机代码来实现。计算机程序不旨在限于任何特定的编程语言及其实现。应当理解,各种编程语言及其代码可以用于实现本文所包含的公共内容的教导。而且,计算机程序不旨在限于任何特定的控制流。在不脱离本文的范围的情况下,计算机程序还有许多其他变体,其可以使用不同的控制流。

此外,计算机程序的一个或多个步骤可以并行而不是顺序地执行。这样的计算机程序可以存储在任何计算机可读介质上。计算机可读介质可以包括诸如磁盘或光盘的存储设备、存储芯片、或适合于与计算机接口的其他存储设备。计算机可读介质还可以包括诸如在互联网系统中例示的硬连线介质,或者诸如在GSM移动电话系统中例示的无线介质,以及诸如蓝牙、ZigBee、Wi-Fi的其他无线系统。当在这样的计算机上加载并执行该计算机程序时,该计算机程序有效地产生了实现优选方法的步骤的装置。

本文还可以被实现为硬件模块。更具体地,在硬件意义上,模块是被设计为与其他组件或元件一起使用的功能硬件模块。例如,可以使用分立的电子组件来实现一个模块,或者元件可以形成整个电子电路的一部分,例如专用集成电路(ASIC)或现场可编程门阵列(FPGA)。存在许多其他可能性。本领域技术人员将理解,该系统还可以被实现为硬件和软件模块的组合。

身份证明文件认证是验证身份真实性的行为或处理,并且可以视为欺诈检测或伪造身份检测的一种形式,其中,在欺诈行为被实施之前,要验证用户的合法性并可以检测到潜在的欺诈者。有效的身份证明文件认证通过仅允许经过认证的具有有效身份的用户访问其受保护的资源,可以增强系统的数据安全性。实施例试图提供用于具有认证功能的身份证明文件处理的方法和装置,其可以检测欺诈者提供的试图完成eKYC处理的非真实身份证明文件的身份证明文件图片。有利地,可以有效地减少或消除诸如洗钱和欺诈的财务风险。

本文描述的技术产生一种或多种技术效果。在一些实施方式中,从两个不同的有效距离拍摄的ID卡的两个图像被用于eKYC处理。可以从近距离拍摄第一身份证明文件图像以通过OCR提取关键信息,并且可以从较长距离拍摄第二身份证明文件图像以通过检查第二身份证明文件图像中的背景来对ID卡进行认证。有利地,这样的技术可有效地检测是真实的物理ID卡的图片还是屏幕截图或纸张打印副本的图片。在某些实施方式中,检查第二身份证明文件图像中的背景并确定ID卡的真实性包括采用基于卷积神经网络(CNN)的二元分类器,该分类器在真实ID卡图像和非真实ID卡图像上进行训练,以准确返回ID卡的真实性结果。

图1是示出用于身份证明文件处理的示例性方法的流程图100,包括以下步骤:

-110:图像获取模块从第一有效位置拍摄身份证明文件的第一图像,使得可以从第一图像提取身份证明文件上的文本;

-120:图像获取模块从第二有效位置拍摄身份证明文件的第二图像,使得第二图像包括身份证明文件及其背景;

-130:从第一图像提取身份证明文件上的文本;以及

-140:至少基于第二图像中的背景,由认证模块对身份证明文件进行认证。

在步骤110,由图像获取模块从第一有效位置拍摄身份证明文件的第一图像。图像获取模块可以是移动电话或笔记本电脑的摄像头。对于具有变焦镜头的图像获取模块,如果焦距改变,则认为“有效位置”也会改变。第一图像应该是身份证明文件的清晰近景图像,从而可以提取身份证明文件上的文本。

在步骤120,由图像获取模块从第二有效位置拍摄身份证明文件的第二图像。第二图像应包括ID卡和ID卡放置位置的背景。与第一图像相比,第二图像中的ID卡较小,从而ID卡的背景可以存在于图像中。在一些实施方式中,如果第一有效位置对应于距身份证明文件的第一有效距离,第二有效位置对应于距身份证明文件的第二有效距离,则第二有效距离比第一有效距离长。例如,在拍摄到第一图像之后,可以通过将相机移动远离身份证明文件来拍摄第二图像。

在步骤130,可以从第一图像提取身份证明文件上的文本,例如姓名、性别、出生日期、身份证明文件号、国家、地址、身高等。文本可以包含字符、数字和符号。在一些实施方式中,基于诸如tesseract的OCR算法来提取身份证明文件的文本。

在步骤140,认证模块至少基于第二图像中的背景对身份证明文件进行认证。背景中的特征可以有利地帮助确定第二图像中的身份证明文件是真实的还是非真实的。例如,如果第二图像是从纸张打印的身份证明文件的彩色副本中拍摄的,则背景可能包含纸张的边界,并且该身份证明文件被确定为非真实的。

在一些实施方式中,对身份证明文件进行认证还可以包括比较第一图像和第二图像中的身份证明文件。这是为了验证在两个图像中使用了相同的身份证明文件。在实施方式中,身份证明文件分类模块可以用于对图像中的身份证明文件进行分类(例如,来自某个国家的统一身份证明文件、驾驶执照、护照),并确保它们是相同类型的身份证明文件。身份证明文件分类模块可以基于用于对电子文档图像进行分类的算法。在一些实施方式中,可以与OCR步骤同时地对身份证明文件进行分类。在一些实施方式中,对身份证明文件进行认证要求第一图像和第二图像中的身份证明文件具有相同的身份证明文件类型。否则,该处理终止。

在一些实施方式中,比较两个图像中的身份证明文件还可以包括提取和比较两个图像中的身份证明文件上的人脸。这是为了确保使用了同一个人的身份证明文件。在实施方式中,可以使用人脸识别和人脸比较模块来比较人脸。人脸识别模块可以基于诸如FaceNet、Deep身份证明文件3等的算法。在一些实施方式中,对身份证明文件进行认证需要从两个图像提取的人脸匹配。否则,该处理终止。

在一些实施方式中,基于卷积神经网络(CNN)的二元分类器可用于对身份证明文件进行认证。基于CNN的二元分类器可以利用图像中的身份证明文件的背景对包括多个真实身份证明文件图像和多个非真实身份证明文件图像的历史数据进行训练。在一些实施例中,非真实身份证明文件图像可以包括具有屏幕背景或屏幕边界的、身份证明文件的屏幕截图的图像。在一些实施例中,非真实身份证明文件图像可以包括具有纸张背景或纸张边界的纸张打印的身份证明文件的图像。可以采用不同的CNN架构,例如resnet18。在一些实施方式中,在基于第二图像对身份证明文件进行认证之后,可以通过包括第二图像和身份证明文件的真实性的结果来更新历史数据,从而可以提高分类器的准确性和鲁棒性。

图2是示出了使用参考图1描述的用于身份证明文件处理的方法的示例性eKYC处理的流程图200。在该处理的开始,用户启动eKYC处理。在下一步骤中,用户利用移动设备的摄像头从第一距离L1拍摄第一身份证明文件图像“I_near”210。用户可以调整ID卡与移动设备之间的第一距离L1,以使“I_near”210中的身份证明文件上的文本清晰可提取。在一些实施例中,“I_near”210仅包含ID卡周围具有最小背景的ID卡,第一距离L1是距ID卡的短距离。

可从I_near 210提取关键的身份证明文件信息,例如,姓名(姓、名、中间名),性别、出生日期、地址、卡号、国家和身份证明文件类型。可以理解,I_near 210适用于从身份证明文件提取文本。但是,由于ID卡周围的背景很少,因此难以检查ID卡的真实性。

在下一步骤中,用户利用摄像头从第二距离L2拍摄第二身份证明文件图像“I_long”210。用户可以调节ID卡与移动设备之间的第二距离L2,使得ID卡的背景可以被包括在“I_long”220中。在本示例中,第二距离L2长于第一距离L1。对于具有变焦镜头的相机,考虑到焦距,L1和L2是相机和ID卡之间的有效距离。

在本示例中,I_long 220是显示在屏幕上的、ID卡的图像,并且ID卡的背景示出了屏幕的边界224。根据I_long 220,基于来自身份证明文件的背景的特征(例如,屏幕边界224),可以将身份证明文件确定为非真实的。可以理解,I_long 220在身份认证中是有用的。从I_near 210提取文本并基于I_long 220对身份证明文件进行认证之后,eKYC处理结束。

在一些实施方式中,eKYC处理可以向用户提示或显示指令,从而引导用户拍摄ID卡的图像。在一些实施例中,eKYC处理可以通过在移动设备屏幕上显示指示要放置ID卡的区域的框或框的角来与用户交互。在本实施例中,I_near 210中的ID卡的区域大于I_long220中的ID卡的区域。在一些实施方式中,可以通过将用户提供的信息与从身份证明文件提取的信息进行比较,基于从身份证明文件的第一图像提取的文本来确定身份证明文件的真实性。在一些实施方式中,身份证明文件可以是卡以外的形式,例如护照。

图3是从两个距离L1和L2拍摄ID卡的图像的示例的示意图300。从较短的距离L1,身份证明文件图像拍摄较小的区域,该区域可能仅为ID卡。从较长的距离L2,身份证明文件图像拍摄较大的区域,包括ID卡及其背景。在实施方式中,L1和L2可以分别是与用于拍摄身份证明文件图像的第一有效位置和第二有效位置相对应的距离。在本示例中,第一有效位置和第二有效位置相对于ID卡具有相同的角度,并且仅距离不同。可以理解,第一有效位置和第二有效位置也可以从不同的角度,只要可以从第一图像提取身份证明文件上的文本并且在第二图像中包括身份证明文件的背景即可。

图4是包括用于身份证明的模块的示例性装置400的示意图。装置400至少包括图像获取模块410和认证模块420。参考图1和图2,图像获取模块可以被配置为拍摄图像。装置400可以包括一个以上的图像获取模块410,并且第一图像和第二图像可以由相同或不同的图像获取模块410拍摄。认证模块420可以被配置为基于图像获取模块410拍摄的图像来对身份证明文件进行认证。装置400可以附加地包括:OCR模块,被配置为从图像提取文本;以及训练模块,被配置为训练分类器,诸如基于CNN的二元分类器。装置400还可以包括:身份证明文件分类模块,被配置为对图像中的身份证明文件的身份证明文件类型进行分类;以及人脸比较模块,被配置为比较第一图像和第二图像中的身份证明文件上的人脸。装置400还可包括输出模块,被配置为输出OCR模块提取的信息和认证模块获得的认证结果。这些模块中的一个或多个或者任何组合可以是用于身份证明文件处理的装置的一部分。

先前实施例中所述的系统、装置、模块或单元可以通过使用计算机芯片或实体来实现,或者可以使用具有特定功能的产品来实现。典型的实施例设备是计算机,计算机可以是个人计算机、笔记本电脑、手机、照相手机、智能手机、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板电脑、可穿戴设备、或这些设备的任何结合。被描述为单独部件的模块可以是或不是物理上分离的,并且被显示为模块的部件可以是或不是物理模块,可以位于一个位置,或者可以分布在多个网络模块上。可以基于实际需求来选择一些或所有模块,以实现本文方案的目标。本领域普通技术人员无需付出创造性劳动就能理解和实现本文的实施例。

图5是适合于执行图1和图2所示的示例性方法的至少一些步骤的示例性计算机系统500的框图。仅以举例的方式提供对计算设备500的描述,而不旨在进行限制。

如图5所示,示例性计算设备500包括用于执行软件例程的处理器502。尽管为了清楚起见示出了单个处理器,但是计算设备500还可以包括多处理器系统。处理器502连接到通信基础设施506,以与计算设备500的其他组件进行通信。通信基础设施506可以包括例如通信总线、交叉开关或网络。

计算设备500还包括诸如随机存取存储器(RAM)之类的主存储器504和辅助存储器510。辅助存储器510可以包括例如存储驱动器512和/或可移动存储驱动器514,其中存储驱动器512可以是硬盘驱动器、固态驱动器或混合驱动器,可移动存储驱动器514可以包括磁带驱动器、光盘驱动器、固态存储驱动器(例如USB闪存驱动器、闪存设备、固态驱动器或存储卡)等。可移动存储驱动器514以众所周知的方式对可移动存储介质518进行读取和/或写入。可移动存储介质518可以包括由可移动存储驱动器514读取和写入的磁带、光盘、非易失性存储器存储介质等。如相关领域技术人员将理解的那样,可移动存储介质518包括其中存储有计算机可执行程序代码指令和/或数据的计算机可读存储介质。

在可选实施方式中,辅助存储器510可以附加地或可选地包括用于允许将计算机程序或其他指令加载到计算设备500中的其他类似装置。这样的装置可以包括例如可移动存储单元522和接口520。可移动存储单元522和接口520的示例包括程序盒和盒接口(例如视频游戏机设备中的接口)、可移动存储芯片(例如EPROM或PROM)和相关联的插槽、可移动固态存储驱动器(例如USB闪存驱动器、闪存设备、固态驱动器或存储卡以及允许软件和数据从可移动存储单元522传输到计算机系统500的其他可移动存储单元522和接口520。

计算设备500还包括至少一个通信接口524。通信接口524允许软件和数据经由通信路径526在计算设备500和外部设备之间传送。在本文的各种实施例中,通信接口524允许在计算设备500和诸如公共数据或私有数据通信网络之类的数据通信网络之间传输数据。通信接口524可以用于在不同的计算设备500之间交换数据,这些计算设备500形成互连的计算机网络的一部分。通信接口524的示例可以包括调制解调器、网络接口(诸如以太网卡)、通信端口(诸如,串口、并口、打印机、GPIB、IEEE 1394、RJ45、USB)、具有相关电路的天线等。通信接口524可以是有线的或者可以是无线的。经由通信接口524传送的软件和数据的形式为信号,该信号可以是能够被通信接口524接收的电、电磁、光或其他信号。这些信号通过通信路径526提供给通信接口。

如图5所示,计算设备500还包括:显示器接口528,其执行用于将图像呈现到相关联的显示器530的操作;以及音频接口532,其执行用于经由相关联的扬声器534播放音频内容的操作。

如本文所使用的,术语“计算机程序产品”可以部分地指代可移动存储介质518、可移动存储单元522、安装在存储驱动器512中的硬盘、或承载通过通信路径526(无线链路或电缆)至通信接口524的软件的载波。计算机可读存储介质是指将记录的指令和/或数据提供给计算设备500以执行和/或处理的任何非暂时性、非易失性有形存储介质。这种存储介质的示例包括磁带、CD-ROM、DVD、蓝光(Blu-ray

计算机程序(也称为计算机程序代码)存储在主存储器504和/或辅助存储器510中。也可以经由通信接口524接收计算机程序。此类计算机程序在被执行时使计算设备500能够执行本文所讨论的实施例的一个或多个特征。在各种实施例中,计算机程序在被执行时使处理器502能够执行上述实施例的特征。因此,此类计算机程序表示计算机系统500的控制器。

软件可以存储在计算机程序产品中,并可以使用可移动存储驱动器514、存储驱动器512或接口520加载到计算设备500中。计算机程序产品可以是非暂时性计算机可读介质。可选地,可以通过通信路径526将计算机程序产品下载到计算机系统500。该软件在由处理器502执行时使计算设备500执行必要操作从而执行如图1和图2所示的方法。

应该理解,图5的实施例仅以举例的方式给出以解释系统500的操作和结构。因此,在一些实施例中,可以省略计算设备500的一个或多个特征。而且,在一些实施例中,计算设备500的一个或多个特征可以被组合在一起。另外,在一些实施例中,计算设备500的一个或多个特征可以被分成一个或多个组成部分。

在实施方式中,服务器通常可以被描述为包括至少一个处理器和包括计算机程序代码的至少一个存储器的物理设备。所述至少一个存储器和计算机程序代码被配置为与所述至少一个处理器一起使所述物理设备执行必要的操作。

本领域技术人员将理解,在不脱离如广泛描述的本文的范围的情况下,可以对本文特定实施例所示的内容进行多种变化和/或修改。因此,所述实施例在所有方面都应被认为是说明性的而非限制性的。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号