法律状态公告日
法律状态信息
法律状态
2020-03-31
未缴年费专利权终止 IPC(主分类):G06K9/00 授权公告日:20171017 终止日期:20190414 申请日:20130414
专利权的终止
2017-10-17
授权
授权
2014-11-12
实质审查的生效 IPC(主分类):G06K9/00 申请日:20130414
实质审查的生效
2014-10-15
公开
公开
技术领域
本发明涉及一种基于机器视觉的图像识别领域,尤其涉及一种基于图割模型的人眼状态识别方法,特别是监控视频中人眼状态(睁/闭)的自动检测方法,其适用于各型机动车辆的司机驾驶过程中疲劳状态的离线式、自动识别。
背景技术
疲劳驾驶严重影响驾驶员的警觉性、应变性及安全驾驶能力。根据交通事故统计:全世界范围内,超过30%的公路交通事故与驾驶疲劳有关,而在中国超过40%的重大交通事故直接或间接是由疲劳驾驶所引发。因此,许多国家和专业部门都在积极开展有关驾驶疲劳的研究工作。驾驶人疲劳状态的检测方法可大致分为基于驾驶人生理信号、基于驾驶人生理反应特征、基于驾驶人操作行为和基于车辆状态信息的检测方法。大量实验证明基于生理反应特征的PERCLOS检测方法是准确率最高的检测方法,也是被美国公路交通安全局(NHTSA)惟一认可的疲劳驾驶检测方法。
基于PERCLOS系数的疲劳检测方法是通过检测监控视频中人眼状态(开或闭),来判断驾驶员疲劳程度的方法。行车环境中由于受到光照变化和摄像头抖动等因素的影响,从视频中提取的眼睛区域图像质量一般较差,这些影响都会使得前景目标(人眼)难以从这些复杂背景中提取,更增加了精确定位的难度。因此,从眼睛区域图像中,如何将眼睛像素和背景区域精确分割开,是基于PERCLOS检测方法最关键的步骤,也是决定该检测方法成败的关键因素。
现有的眼睛检测方法要可分为三类:基于模板的方法、基于外形的方法和基于特征的方法。基于模板的方法需要设计一个基于眼睛形状的通用模板,然后使用模板匹配搜索感兴趣区域中眼睛的位置。基于外形的方法利用眼睛的几何形状进行眼睛检测,一般使用神经网络或SVM等统计分类器对数据实现分类。基于特征分析的方法提取眼睛的一些特征作为识别眼睛的基础,这些特征可包括颜色特征、眼睑形状、瞳孔密度、灰度分布特征、虹膜边缘特征、眼睛角点特征等。
现有眼睛检测方法存在以下不足:
(a) 基于模板的方法中通用模板的选取是一个难点,不同人的眼睛大小形状都不一样,而且采用模板匹配的方法需要全图搜索匹配,速度相对较慢,难以满足实时检测的要求;
(b)基于外形的方法需要采集大量的训练样本,提供不同对象、不同面部朝向、不同光照环境和不同睁闭程度下的眼睛信息作为训练集,而样本的选取往往不能涵盖实际应用中的各种情况;
(c) 基于特征分析的方法虽然计算量小速度快,但是眼睛特征随着人脸的表情,头部的姿态及外界环境的改变会呈现极大的不稳定性,所以这种检测方法的识别准确率不是很高。
发明内容
本发明的目的在于克服上述技术问题的缺陷,解决当前疲劳检测系统不能精确检测人眼状态(睁或闭)的问题。本发明基于图割模型的图像前景提取方法,用来精确分割出人眼图像中的人眼椭圆区域,定义了人眼图像的图割模型和能量函数,并用最大流最小割算法优化能量函数,以此为理论发明了一种把人眼图像分割为二值化的人眼椭圆区域的算法,并把人眼区域面积作为计算PERCLOS系数的特征量,用来进行驾驶疲劳状态的自动检测。
根据本发明的具体实施,提供一种基于图割模型的人眼状态识别方法,其特征在于包括以下步骤:
步骤1)构造图割模型:
基于图割(Graph Cuts)的图像分割方法把图像分割与图的最小割(min cut)问题相关联。首先将图像映射为带权无向图G=<V,E>,无向图中每个节点∈V对应于图像中的每个像素,每条边∈E连接着一对相邻的像素。在普通图的基础上多了2个顶点,这2个顶点分别用符号“S”和“T”表示,统称为终端顶点,其它所有的顶点都必须与这2个顶点相连形成边集合中的一部分。因此Graph Cuts模型中有两种顶点,也有两种边。第一种顶点和边是:对应于图像中每个像素的普通顶点,每两个邻域顶点(对应于图像中每两个邻域像素)的连接就是一条边,这种边叫n-links。第二种顶点和边是:除图像像素外的另外两个终端顶点,叫S(source: 源点)和T(sink:汇点),每个普通顶点和这2个终端顶点之间都有连接,组成第二种边,这种边叫t-links。图1为一个图像对应的图割模型,也叫S-T图。在图像分割中,S一般表示前景目标,T一般表示背景。
步骤2)构造图割模型的能量函数:
Graph Cuts中的割是指这样一个边的集合,集合中所有t-links边的断开会导致残留“S”和“T”图的分开,即其中一部分点仅和S连接,被判断为前景;而一些仅和T连接,被判断为背景。很明显,发生在目标和背景的边界处的割就是图像分割所需要的,找到正确的割即可得到最优的分割结果。下面将图像分割的先验约束具体化,以能量函数的形式作为图割模型的优化目标。寻找最优割的过程可以通过最小化图割能量函数得到。
假设整幅图像的标签label为
其中,
边界项
步骤3)最大流最小割算法优化能量函数:
图割的目标就是优化能量函数使其值达到最小,即
若将格式上述定义的惩罚项作为图模型的边权重,即
最大流最小割算法优化能量函数的描述如下:
(1)对于有向图
(2)若给定一个可行流
上述第(2)步Edmonds-Karp算法就是利用宽度优先原则,不断地找一条从s到t的可改进路径,然后改进流量,一直到找不到可改进路径为止。Edmonds-Karp算法有一个很重要的性质:当汇点未标号而导致算法结束的时候,那些已经标号的节点构成集合
本发明将起到以下积极效果:
(1)利用眼睛区域灰度值分布的特点作为先验知识,给图割模型中的惩罚项赋值。这种基于先验的优化方法,分割结果准确率比较高;
(2)算法以图像的像数点为基本单元构建图割模型,将像数灰度值信息作为模型优化的输入,因此对于表情变化引起的眼睛形变,随机噪声等干扰因素有较强的鲁棒性;
(3)本算法不需要训练学习过程,可以在线进行检测,而且利用最大流最小割算法进行模型优化,求解速度快,适用于实时检测的场景。
附图说明
图1示出了图像构造图割模型(S-T图)的方法;
(说明:
图2示出了最大流最小割算法图像分割过程示例;
图3示出了本发明人眼状态自动识别算法的流程图;
图4示出了三种不同的眼睛状态及其对应分割结果。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步的详细描述。需要注意的是,根据本发明的基于图割模型的人眼状态识别方法的具体实施方式仅仅作为举例,但本发明不限于该具体实施方式。
下面结合附图,对本发明作详细的阐述。
实时监控视频中检测到人脸并定位到眼睛之后,需要进行眼睛图片的处理,来识别眼睛的开闭状态,作为疲劳程度的最终判据。处理眼睛图像时,为了减小光照等的影响,首先用直方图均衡化方法预处理眼睛图像,增强图像对比度;然后基于预处理的图像,构造图割模型;最后,利用最大流最小割算法优化图割模型的能量函数,得到最后眼睛分割结果。处理算法流程如图3所示。具体实施步骤为:
(1)直方图均衡化预处理原始图像I, 增强对比度;
(2)基于图像灰度值信息构造图割模型。图1给出了图割模型的构造方法;
(3)构造图割模型的能量函数:
由公式1可知,图割模型的构造关键是确定区域项
A. 区域项
图片分割结果中,前景标签label为1;背景标签为label为0。在基于检测的粗定位得到的眼睛图片中,眼睛前景区域灰度值较低接近0,而周围背景(人脸皮肤区域)灰度值较大接近255。 所以对应正确的分割结果中,灰度值小的标签label为1的可能性大,灰度值较大的标签lbael为0的可能性大。在构造待分割图像的能量函数时,应根据以上的先验设定区域项
B.边界项
由于边界项惩罚
(4)设置好能量函数
(5) 根据图割得到的二值化人眼图像
(4)
实例应用分析
图4为三种不同的眼睛状态图像以及采用本发明方法的分割结果。从图4可以看出:三种不同的眼睛状态,本发明方法能够精确的从原始眼睛图片中分割出眼睛椭圆区域。可能由于周围头发眼镜等因素的影响,分割图片中可能存在一些细小的独立区域,这些都可以通过面积约束过滤掉,只留下区域最大的眼睛椭圆区域。
机译: 人眼模型训练方法,人眼识别方法,装置,设备和介质
机译: 基于多态变分推理和切换状态空间模型的语音识别方法
机译: 基于变态推断的开关状态空间模型的语音识别方法。