法律状态公告日
法律状态信息
法律状态
2018-03-30
授权
授权
2018-03-09
专利申请权的转移 IPC(主分类):G06K9/00 登记生效日:20180222 变更前: 变更后: 申请日:20140919
专利申请权、专利权的转移
2015-02-04
实质审查的生效 IPC(主分类):G06K9/00 申请日:20140919
实质审查的生效
2015-01-07
公开
公开
技术领域
本发明涉及图像识别技术,特别涉及基于模式匹配的图像识别及显示方法。
背景技术
模式匹配算法在目前的计算机领域中运用很广,从网络安全到增强现实都有涉及,其算 法也多种多样,我们这里讨论一种基于模式匹配的图形图像识别算法,以及在增强现实领域 应用的优化方法。
图像识别问题的数学本质属于模式空间到类别空间的映射问题。目前,在图像识别的发 展中,主要有三种识别方法:统计模式识别、结构模式识别、模糊模式识别。在增强现实技 术领域,主要使用的是统计模式识别、结构模式识别这两种,例如法国Total immersion公 司所发布的增强现实SDK中就使用的这两种算法。但是在实际使用中,该SDK在识别对象角 度和距离发生改变时,所产生的跟踪丢失率较大,且识别容错率较低,不能于有较大识别距 离和较大空间要求的场景。
发明内容
本发明的目的是为了解决目前增强现实领域中图像识别在识别对象角度和距离发生改变 时所产生的跟踪丢失率较大,且识别容错率较低,不能于有较大识别距离和较大空间要求的 场景的问题。
为达到上述目的,本发明提供一种基于模式匹配的图像识别方法,其特征在于,包括如 下步骤:
A.将需要识别的目标对象的图像特征点矩阵作为模式匹配图像存储在系统中;
B.系统采集图像,将采集到的连续图像信号按照固定的采集频率变成离散图像信号;
C.对离散图像信号进行平滑处理并对平滑处理后的图像进行分割,得到背景图像及被识 别图像;
D.将被识别图像与模式匹配图像进行模式匹配,若匹配,说明被识别图像即为目标对象 的图像,程序结束,否则,跳转到步骤B。
进一步地,步骤D中,若被识别图像与模式匹配图像相匹配,则进一步包括步骤:
E.对被识别图像进行轮廓跟踪,判断识别被识别图像的位置、角度及远近变化;
F.三维处理引擎根据被识别图像的位置、角度及远近变化信息计算出二维或三维影像放 置的位置,并叠加到帧图像中,最后进行显示。
具体地,步骤C中采用消噪声掩模法对图像进行平滑处理,具体操作为:设定一个模板 算子,将模板嵌入到每一帧图像的每一个像素,将该像素的灰度值与其相关邻域的各像素灰 度值求和并求其平均值,用平均值代替该像素的灰度值。
具体地,步骤C中,采用全局阀值法对图像进行分割,其具体操作为:设定一个灰度值 的阀值,灰度值大于阀值的部分为背景图像,小于阀值的部分为被识别图像。
具体地,步骤C中,对背景图像进行二值化处理全部为1,表示亮,对被识别图像进行 二值化处理全部为0,表示暗。图像二值化的具体操作为:f(x,y)大于或等于T时,g(x,y) 取值为1,f(x,y)小于T时,g(x,y)取值为0,其中f(x,y)表示图像分割前图像中的坐标(x,y) 像素的灰度值,g(x,y)表示图像分割后图像中的坐标(x,y)像素的灰度值,T为规定的全局阀 值。二值化处理的目的是明确的从复杂的背景中标识出被识别图像,避免识别干扰,因为背 景是什么内容算法并不关心。
具体地,步骤B中,系统采集的图像为8位灰度值图像,所述采集频率为每秒24帧。
针对上述方法,本发明还提供一种基于模式匹配的图像识别的终端,包括:
图像采集模块,用于采集获取视频数据,将采集的视频数据进行模数转换得到离散图像;
图像预处理模块,将所述离散图像进行平滑处理,实现衰减高频分量、增强低频分量的 目的;
图像分割模块,将平湖处理后的图像进行分割,得到背景图像及被识别图像;
模式匹配模块,将被识别图像与预设的模式匹配图像进行模式匹配,根据匹配结果确定 被识别图像是否为目标对象的图像。
进一步地,为更好地对目标对象的图像进行显示,还包括:
轮廓跟踪模块,用于对目标对象进行轮廓跟踪,判断识别目标图像的位置、角度及远近 变化;
三维处理引擎,用于根据被识别图像的位置、角度及远近变化信息计算出二维或三维影 像放置的位置,并叠加到帧图像中,最后将图像在显示模块上进行显示。
本发明的有益效果是:本发明的方法在图像采集过程中采取多组件协同采集,并对采集 到的图像进行平滑处理,提高采集效率的同时也为后期图像分割提高了效率。识别过程首先 消噪,提高了识别距离和准确度,轮廓跟踪提高了容错性,集成三维引擎提高了增强现实效 果。
附图说明
图1为本发明的基于模式匹配的图像识别的终端的原理框图。
具体实施方式
下面结合附图及实施例对本发明的技术方案进行详细描述,实施例仅仅是为了帮助读者 更好地理解本发明方案的核心内容,并不用以限制本发明的保护范围。
本发明针对目前增强现实领域中图像识别在识别对象角度和距离发生改变时所产生的跟 踪丢失率较大,且识别容错率较低,不能于有较大识别距离和较大空间要求的场景的问题, 提供一种基于模式匹配的图像识别方法,具体步骤如下:首先将需要识别的目标对象的图像 作为模式匹配图像存储在系统中,使用过程中系统通过摄像头实时采集图像,并将采集到的 连续图像信号按照固定的采集频率变成离散图像信号。其次,系统对离散图像信号进行平滑 处理并对平滑处理后的图像进行分割,得到背景图像及被识别图像。然后,将被识别图像与 模式匹配图像进行模式匹配,若匹配,说明被识别图像即为目标对象的图像,程序结束,否 则继续采集图像后进行平滑处理及图像分割后进行模式匹配。
如图1所示,本发明提供的基于模式匹配的图像识别的终端,包括:图像采集模块、图 像预处理模块、图像分割模块及模式匹配模块,各个模块的功能如下:
图像采集模块,用于采集获取视频数据,将采集的视频数据进行模数转换得到离散图像;
图像预处理模块,将所述离散图像进行平滑处理,实现衰减高频分量、增强低频分量的 目的;
图像分割模块,将平湖处理后的图像进行分割,得到背景图像及被识别图像;
模式匹配模块,将被识别图像与预设的模式匹配图像进行模式匹配,根据匹配结果确定 被识别图像是否为目标对象的图像。
在图像识别完成之后还需要进行显示,为提高增强现实的效果,本发明进一步对被识别 图像进行轮廓跟踪,判断识别被识别图像的位置、角度及远近变化。之后使用三维处理引擎 根据被识别图像的位置、角度及远近变化信息计算出二维或三维影像放置的位置,并叠加到 帧图像中,最后进行显示。相应地,本发明提供的基于模式匹配的图像识别的终端还包括显 示模块、轮廓跟踪模块及三维处理引擎,三维处理引擎为现有的处理技术,本领域普通技术 人员根据其所要实现的功能即能予以实现。
轮廓跟踪模块及三维处理引擎的功能如下:
轮廓跟踪模块,用于对目标对象进行轮廓跟踪,判断识别目标图像的位置、角度及远近 变化;
三维处理引擎,用于根据被识别图像的位置、角度及远近变化信息计算出二维或三维影 像放置的位置,并叠加到帧图像中。
实施例
下面举一实例对本发明的基于模式匹配的图像识别的终端的图像识别方法进行进一步描 述。
基于本发明的方法的口袋家居系统,终端为采用移动智能设备为硬件载体,使用大于500 万像素的摄像头实时采集图像,识别特定的二维码图像,最大识别距离为6米,最大识别角 度为145度。在最大识别距离和最大识别角度内,目标对象移动丢失率为3%,能在最大40 平米的房间布置8款虚拟的三维家具模型。
将需要识别的目标对象的图像作为模式匹配图像存储在系统中之后进行如下的操作。
图像采集:通过移动终端设备的摄像头获取视频数据,将连续的图像信息按照固定的采 集频率变成离散图像,此处频率为每秒24帧。我们采用VC++中的MCIAVI、DRAWDIB、AVIFILE、 AVICAP等组件协同工作完成对实时图像数据的采集。
图像预处理:图像采集后进行平滑处理,主要采取的方法是消噪声掩模法,设定一个模 板算子,如3x3,将模板嵌入到每一帧图像的每一个像素,将该像素的灰度值与其八邻域的 各像素灰度值求和,再取平均值代替该像素的灰度值,实现衰减高频分量,增强低频分量的 目的。
图像分割,图像分割是图像处理中的关键步骤,因为它去除了图像中大量无用的信息, 为后续图像处理减少了负担。我们采用的方法是全局阀值法,阀值法是用于区分不同目标的 灰度,即将整幅图像用统一的阀值划分标准,由于本系统采集进来的图像是8位灰度值图像, 通过阀值分割,得到大于域值的部分被认为是背景,二值化处理全部为1,表示亮;得到小 于域值的部分被认为是被识别图形或物体,二值化处理全部分0,表示暗。图像二值化的具 体操作为:f(x,y)大于或等于T时,g(x,y)取值为1,f(x,y)小于T时,g(x,y)取值为0, 其中f(x,y)表示图像分割前图像中的坐标(x,y)像素的灰度值,g(x,y)表示图像分割后图像 中的坐标(x,y)像素的灰度值,T为规定的全局阀值。二值化处理的目的是明确的从复杂的背 景中标识出被识别图像,避免识别干扰,因为背景是什么内容算法并不关心。
图像分割的目的是为了将背景图像及被识别图像进行分割,图像分割之后,将被识别图 像与模式匹配图像进行模式匹配,若匹配,说明被识别图像即为目标对象的图像,程序结束, 否则继续采集图像后进行平滑处理及图像分割后进行模式匹配。
在识别出图像之后进行轮廓跟踪,判断识别被识别图像的位置、角度及远近变化。轮廓 跟踪的具体操作为:从图像的一个点作为起点,按照四邻域或八邻域关系逐像素点跟踪轮廓。 同时在找到一个边缘点后,记录此时移动的方向,直到不能移动结束本次跟踪过程。三维处 理引擎根据被识别图像的位置、角度及远近变化信息计算出二维或三维影像放置的位置,并 叠加到帧图像中,最后进行显示。
机译: 用于图像识别的服务器,用于图像识别的便携式终端设备,图像识别方法,用于图像识别的程序,用于记录用于图像识别的程序的存储介质
机译: 利用该检测值的相似度检测方法和语音识别方法的语音度,利用检测值的相似度检测方法和机器异常识别方法的振动度,类似检测度的图像度,使用检测方法的图像识别值方法探测值和动画图像识别度的相似度检测方法和实体图像识别方法探测值和动画图像识别度的图像相似度检测方法
机译: 语音的相似度检测方法和使用其检测值的语音识别方法,振动波的相似度检测方法和使用该检测值的机器异常确定方法,图像的相似度检测方法及其检测使用值的图像识别方法,立体相似度检测方法使用检测到的值的立体识别方法,使用检测到的值的运动图像相似性检测方法和运动图像识别方法