首页> 中国专利> 一种基于计算机视觉的七段式数显仪表数字识别方法

一种基于计算机视觉的七段式数显仪表数字识别方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明涉及一种对七段式数显仪表数字识别方法。传统数显仪表的数字识别方法是模板匹配，由于图像中字符位置分布不一致，基于模板匹配的数字识别方法效率较低。近年来，基于神经网络的数字识别方法尽管在训练集上识别准确率较高，但在训练集之外的数字识别处理上不尽如人意。本发明提供一种通过预处理将图像转换成灰度图像，之后再进一步转换为二值图像，定义字符区域后再进行增强处理；对图像分割，得到单字符图像，对单字符进行数字识别。基于对七段式数显仪表中数字形态上的研究，提取数字特征，根据图像孔洞数对数字分类以减少运算量，避免了现有方法中对字符图像尺寸归一化处理，识别准确率高，鲁棒性强。

著录项

公开/公告号CN106682665A

专利类型发明专利
公开/公告日2017-05-17

原文格式PDF
申请/专利权人陕西科技大学;
展开▼

申请/专利号CN201611224481.X
发明设计人姚斌;何立风;王晓霞;
展开▼

申请日2016-12-27
分类号G06K9/20(20060101);G06K9/00(20060101);
代理机构61114 西安新思维专利商标事务所有限公司;
代理人李罡
地址 710021 陕西省西安市未央大学城
入库时间 2023-06-19 02:08:02

法律信息

法律状态公告日

法律状态信息

法律状态
2020-07-14

授权

授权
2017-06-09

实质审查的生效 IPC(主分类):G06K9/20 申请日:20161227

实质审查的生效
2017-05-17

公开

公开

说明书

技术领域

本发明属于图像识别领域，尤其涉及对七段式数显仪表数字识别方法。

背景技术

远程数字视频监控与识别系统是在为了达到人们生产生活中所面临的一些更高要求，而将监控系统与图像识别系统结合起来，接收采集自远程现场的数字视频或图像信号，传送到监控中心，在监控中心对现场进行远程实时监视，控制远程摄像机动作，并能够根据需要对采集到的数字视频、图像进行分析、处理、识别和报警。这样，往往可以在达到实时监控的同时，实现无人值守、自动报警的功能。

传统数显仪表的数字识别方法是模板匹配。由于图像中字符位置分布不一致，基于模板匹配的数字识别方法效率较低。近年来，基于神经网络的数字识别方法尽管在训练集上识别准确率较高，但在训练集之外的数字识别处理上不尽如人意。

发明内容

本发明的目的在于提供一种基于计算机视觉的七段式数显仪表数字识别方法，采用数字图像孔洞数和数字图像中字符特征相结合的方法实现对七段式数显仪表中的数字进行准确、快速、简单地识别。

本发明技术方案如下：

一种基于计算机视觉的七段式数显仪表数字识别方法，其特征在于：终端对采集的图像转换为灰度图像，根据预先设置的阈值对灰度图像转换为二值图像并且定位图像内的字符区域，之后，对所述字符区域进行增强处理并且分割，获得每个字符对应的单字符图像，最后，对每个字符对应的单字符图像进行数字识别，输出识别结果。

所述终端对采集的图像转换为灰度图像，具体为：采用最大值法将采集到的原始彩色图像转换为8位256色灰度图像。

所述根据预先设置的阈值对灰度图像转换为二值图像并且定位图像内的字符区域，具体为：采用最大类间方差法选取阈值，将灰度图像转换为二值图像，再定位图像内的字符区域。

对所述字符区域进行增强处理并且分割，获得单字符图像，具体为：对字符区域进行滤波后,进行先膨胀后复势的闭运算，再分割获得单字符图像。

对每个字符对应的单字符图像进行数字识别，具体为：

1）计算单字符图像中包含的孔洞数；

2）根据图像中包含的孔洞数对字符图像进行分类，对孔洞数相同的字符图像，通过添加辅助识别线或计算图像宽高比例对字符图像进行数字识别；

3) 当计算出的字符图像的孔洞数为2时，则该字符为数字“8”，识别结束；

当计算出的字符图像的孔洞数不为2时，则进一步判断，当计算出的字符图像的孔洞数为1时，则该字符为数字“0”、“6”或“9”，需添加辅助识别线或计算图像宽高比例对字符图像进行数字识别；

当计算出的字符图像的孔洞数不为1时，则进一步判断，当计算出的字符图像的孔洞数为0时，则该字符为数字“1”、“2”、“3”、“4”、“5”或“7”，需添加辅助识别线或计算图像宽高比例对字符图像进行数字识别；

当计算出的字符图像的孔洞数不为0，则非数字字符，识别结束。

所述字符图像的孔洞数为1时，依次在字符图像宽度0.87倍处添加右侧垂直辅助识别线、字符图像宽度0.13倍添加左侧垂直辅助识别线，计算相应的图像孔洞数进行数字识别；

所述字符图像的孔洞数为0时，依次在字符图像0.13倍处添加左侧垂直辅助识别线、图像高度0.95倍（距离图像底部）处添加水平辅助识别线，计算相应的图像孔洞数，最后检测图像的宽度和高度的比值进行数字识别。待拷贝权利要求书。

本发明的有益效果是：与现有技术相比，本发明基于对七段式数显仪表中数字形态的研究，提取数字特征，根据数字字符图像孔洞数对数字字符图像进行分类，对分类后孔洞数量相同的字符图像采用增加辅助识别线后再计算孔洞数的方法减少运算量，避免了现有方法中对字符图像尺寸归一化处理，识别准确率高，鲁棒性强。

附图说明

图1为本方法流程图；

图2为数字识别流程图；

图3为数字“8”的识别说明图；

图4为数字“0”、“6”、“9”的识别说明图；

图5为数字“1”、“2”、“3”、“4”、“5”、“7”的识别说明图。

图中，1-辅助识别线、2-孔洞。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

如图1所示，本发明实施例提供一种基于计算机视觉的七段式数显仪表数字识别方法，包括：

步骤101：终端对采集的图像转换为灰度图像；

步骤102：根据预先设置的阈值对灰度图像转换为二值图像并且定位图像内的字符区域；

步骤103：对所述字符区域进行增强处理并且分割，获得每个字符对应的单字符图像；

步骤104：最后，对每个字符对应的单字符图像进行数字识别；

步骤105：输出识别结果。

步骤101：终端对采集的图像转换为灰度图像。具体地，采用最大值法将获取到的原始的彩色图像转换为8位256色灰度图像。最大值法即转换后图像中每一个像素的灰度值为原彩色图像中该像素的R、G、B分量中的最大值，以保证得到亮度较大的灰度图像。

步骤102：根据预先设置的阈值对灰度图像转换为二值图像并且定位图像内的字符区域。具体地，采用最大类间方差法选取阈值，得到效果较好的二值图像。最大类间方差法：记t为前景与背景的分割阈值，前景像素数量占图像比例为w₀，平均灰度为u₀；背景像素数量占图像比例为w₁，平均灰度为u₁。则图像的总平均灰度为：u=w₀*u₀+w₁*u₁。前景和背景图像的方差：g=w₀*(u₀-u)*(u₀-u)+w₁*(u₁-u)*(u₁-u)=w₀*w₁*(u₀-u₁)*(u₀-u₁)，当方差g最大时，可以认为此时前景和背景差异最大，也就是此时的灰度是最佳阈值。

步骤103：对所述字符区域进行增强处理并且分割，获得每个字符对应的单字符图像。具体地，图像增强处理是将步骤102得到的二值图像进行滤波，以减少灰尘及光照等干扰引起的噪声，然后进行先膨胀后腐蚀的闭运算，使得每一个数字字符是一个连通区域。

滤波具体方法是：从图像的左上角第一个像素开始，利用滤波窗口进行逐个像素的从左到右、从上到下的扫描，用窗口中各点的灰度值的中值来代替窗口中心点像素的灰度值。所述滤波窗口为3×3像素。

使用结构元素为5×5像素的矩形窗口对图像进行闭运算，它具有填充物体内细小的空洞、连接邻近物体、在不明显改变物体面积的情况下平滑其边界的作用。

步骤104：最后，对每个字符对应的单字符图像进行数字识别。具体地，如图2所示，对于每一个单字符图像进行数字识别，需要进行以下步骤：

（1）计算单字符图像中包含的孔洞数；

（2）根据图像中包含的孔洞数对字符图像进行分类。对孔洞数相同的字符图像，通过添加辅助识别线或计算图像宽高比例对字符图像进行数字识别。

数字“0”、“6”、“9”有一个孔洞，数字“1”、“2”、“3”、“4”、“5”、“7”没有孔洞；数字“8”有两个孔洞。计算得到字符图像的孔洞数后，进行如下判断：

（a）参见图3，如果字符图像的孔洞数为2，则该字符为数字“8”；

（b）参见图4，如果字符图像的孔洞数为1，则该字符可能为数字“0”、“6”或“9”；

（c）参见图5，如果字符图像的孔洞数为0，则该字符可能为数字“1”、“2”、“3”、“4”、“5”或“7”。

对于（b）和（c）两种情况需要给字符图像添加辅助识别线或计算图像宽高比例来识别，添加的水平辅助识别线长度大于字符图像宽度，垂直辅助识别线长度大于字符图像高度。

对于（b），如图4所示，首先在孔洞数为1的字符图像宽度0.87倍处添加右侧垂直辅助识别线，然后再计算图像孔洞数。如果图像孔洞数变为2，则该字符图像为数字“6”。如果图像孔洞数不变，则继续在图像宽度0.13倍添加左侧垂直辅助识别线，然后再计算图像孔洞数。如果图像孔洞数变为2，则该字符图像为数字“9”。左右两侧垂直辅助识别线都添加后，如果图像孔洞数仍然为1，则该图像为数字“0”。

对于（c），如图5所示，首先在孔洞数为0的字符图像宽度0.13倍处添加左侧垂直辅助识别线，然后再计算图像孔洞数。如果孔洞数变为2，则该图像为数字“3”；如果孔洞数变为1，继续在图像高度0.75倍（距离图像底部）处添加水平辅助识别线，如果孔洞数变为2，则该图像为数字“2”，如果孔洞数仍然为1，则该图像为数字“5”。

对于在孔洞数为0的字符图像，在图像宽度0.13倍处添加左侧垂直辅助识别线后，孔洞数仍为0的图像，可能是数字“1”、“4”或“7”。这种情况下我们继续在图像高度0.95倍（距离图像底部）处添加水平辅助识别线，如果孔洞数变为1，则该图像为数字“4”。最后对于数字“1”和“7”，检测图像的宽度和高度的比值，如果比值介于0.08-0.2之间，则该图像为数字“1”，如果比值介于0.35-0.6之间，则该图像为数字“7”。

以上所述，仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种基于计算机视觉的七段式数显仪表数字识别方法 [P] . 中国专利： CN106682665B . 2020.07.14
2. 一种基于计算机视觉的七段式数显仪表数字识别方法 [P] . 中国专利： CN106682665A . 2017-05-17
3. Computer vision system for digitization and alarm of industrial equipment gauges [P] . JP2021093161A . 2021-06-17

机译：工业设备仪表仪表数字化和报警的计算机视觉系统
4. The ‘Property Identification Method’ (“PIM”) is a novel algorithm through which a Real Estate Authority and/or Conveyancing data is created through image-processing a document such as a Council/Shire Rates Notice. This invention establishes a unique algorithm incorporating techniques such deep learning segmentation and computer vision to decode property information. This application utilises computer-implemented technology configured in such manner as to enable conveyancers and real estate agents to automate the creation of client files. [P] . AU2020102233A4 . 2020-10-29

机译： “财产识别方法”（“ PIM”）是一种新颖的算法，通过该算法，可以通过对文件（如市议会/房屋价格通知）进行图像处理来创建房地产管理局和/或产权转让数据。本发明建立了一种独特的算法，该算法结合了诸如深度学习分段和计算机视觉之类的技术来解码属性信息。该应用程序利用以某种方式配置的计算机实现的技术，以使运输商和房地产经纪人能够自动创建客户端文件。
5. Back-illuminated alphanumeric information display, comprises e.g. transparent seven-segment display modules with selectively-applied segment covers [P] . 德国专利： DE10216060A1 . 2003-11-06

机译：背照式字母数字信息显示器包括例如透明的七段式显示模块，具有选择性应用的段盖