首页> 中国专利> 基于稀疏自编码码本实现笔迹鉴别的系统及方法

基于稀疏自编码码本实现笔迹鉴别的系统及方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明的基于稀疏自编码码本实现笔迹鉴别的系统及方法，包括图像预处理模块，用以对查询笔迹样本和参考笔迹样本图像进行预处理；参数学习模块，用以根据稀疏自编码和聚类方法来获得权重和码本的参数；特征提取模块，用以根据权重和码本来提取查询笔迹样本和参考笔迹样本图像的特征；距离计算模块，用以最终获得查询笔迹样本书写者的候选列表。采用该系统及方法，利用稀疏自编码来提取图像特征，对所获得的特征间距离进行比较排序，即可实现笔记鉴别，无需对原始笔记图像进行文本分割，相较以往的方法更简洁，对多语种的笔迹鉴别鲁棒性强。

著录项

公开/公告号CN106529490A

专利类型发明专利
公开/公告日2017-03-22

原文格式PDF
申请/专利权人华东理工大学;
展开▼

申请/专利号CN201611029775.7
发明设计人朱煜;王逸宁;
展开▼

申请日2016-11-15
分类号G06K9/00;
代理机构上海智信专利代理有限公司;
代理人王洁
地址 200237 上海市徐汇区梅陇路130号
入库时间 2023-06-19 01:49:42

法律信息

法律状态公告日

法律状态信息

法律状态
2019-10-18

授权

授权
2017-04-19

实质审查的生效 IPC(主分类):G06K9/00 申请日:20161115

实质审查的生效
2017-03-22

公开

公开

说明书

技术领域

本发明涉及计算机视觉技术领域，特别涉及笔记鉴别技术领域，具体是指一种基于智能策略实现主动加载内容的对等网络系统及方法。

背景技术

笔迹鉴别技术目的在于自动鉴别书写人的身份。由于笔迹鉴别在诸如司法、文物鉴别等领域有很广泛的应用，该技术越来越受到学术与工业方面的关注。

笔迹识别一般分为笔迹鉴别和笔迹校验。笔迹鉴别是指在已有参考笔迹样本的情况下，确定查询笔迹样本书写人的身份，而笔迹校验目的在于判断两份笔迹样本是否为同一人所写；笔迹识别还被分为文本相关的和文本无关的两类，文本相关是指书写人被要求书写一些指定内容，而文本无关是指对书写内容不作任何要求；另外，文本识别还被分为在线和离线的，离线文本识别只有笔迹图片，而在线文本识别除了笔迹图片，另外提供书写速度、轨迹、压力等等信息。本发明是一种离线文本无关的笔迹鉴别方法。

现有的计算机自动笔迹鉴别方法一般先提取笔迹样本图片的特征，再进行分类。其中基于码本的特征提取方法在近几年的研究中取得了很好的鉴别效果，其方法为首先使用不同的纹理分割算法来提取纹理图像块，从而生成码本；再通过码本来获得笔迹样本的纹理特征；最后通过比较纹理特征之间的距离来获得候选书写者名单。

现有的技术中，在生成码本之前，大部分需要进行文本分割，文本分割的好坏直接会影响到鉴别效果；另外，现有的码本对多语种的鲁棒性不高，即无法利用同一个码本来对不同的语种笔迹提取特征。文本分割和码本鲁棒性不高都会对该技术的实际应用效果产生影响，故现有的技术还需要有待改进的地方。

发明内容

本发明的目的是克服了上述现有技术的缺点，提供了一种基于稀疏自编码码本实现笔迹鉴别的系统及方法。

为了实现上述目的，本发明的基于稀疏自编码码本实现笔迹鉴别的系统及方法如下：

该计算机软件系统中基于稀疏自编码码本实现笔迹鉴别的系统，包括：

图像预处理模块，用以对查询笔迹样本和参考笔迹样本图像进行预处理，得到两者的二值化图像；

参数学习模块，用以根据稀疏自编码和k-means聚类方法来获得权重和码本的参数；

特征提取模块，用以根据权重和码本来提取查询笔迹样本和参考笔迹样本图像的特征；

距离计算模块，用以计算查询笔迹样本特征与参考笔迹样本特征之间的距离，并比较排序，最终获得查询笔迹样本书写者的候选列表。

该利用上述系统基于稀疏自编码码本实现笔迹鉴别的方法，包括以下步骤：

(1)对查询笔迹样本和参考笔迹样本图像进行预处理，得到两者的二值化图像；

(2)根据稀疏自编码和k-means聚类方法来获得权重和码本的参数；

(3)根据权重和码本来提取查询笔迹样本和参考笔迹样本图像的特征；

(4)计算查询笔迹样本特征与参考笔迹样本特征之间的距离，并比较排序，最终获得查询笔迹样本书写者的候选列表。

较佳地，所述的步骤(1)包括以下步骤：

(1-1)对所述灰度笔迹样本通过OTSU进行二值化，得到笔迹样本的二值化图像；

(1-2)对所述二值化图像进行去噪处理。

较佳地，所述步骤(2)包括以下步骤：

(2-1)设定一个固定大小的窗口，通过该窗口在所述每张参考笔迹样本二值化图中随机选取一定数量的第一子块Set 1，作为训练稀疏自编码模型权重的样本集；

(2-2)采用稀疏自编码模型，将网络模型参数随机初始化；

(2-3)根据所述的第一子块Set 1样本集对稀疏自编码模型进行训练，得到权重参数；

(2-4)通过所述的窗口在每张参考笔迹样本的二值化图中随机选取一定数量的第二子块Set 2，该样本集数量需远大于第一子块Set 1；

(2-5)将所述的第二子块Set 2样本集作为稀疏自编码模型的前向输入，使用训练得到的权重参数，得到隐含层输出；

(2-6)对所述的隐含层输出采用k-means聚类算法，得到码本。

更佳地，所述的采用稀疏自编码模型为单隐含层的稀疏自编码模型或多隐含层的稀疏自编码模型。

更佳地，所述的将网络模型参数随机初始化，具体包括以下步骤：

(2-2-1)随机初始化网络权重参数，输入层和隐含层对应的权重参数矩阵W₁和隐含层和输出层对应的权重参数矩阵W₂为：

W₁＝rand(-r,r)_{hiddensize*visiblesize}，

W₂＝rand(-r,r)_{visiblesize*hiddensize}，

其中hiddensize表示稀疏自编码网络隐含层的个数，visiblesize表示输入层的个数，rand(-r,r)_m*n表示大小为m*n的随机矩阵，其元素取值范围为(-r,r)，并且，r取上述值时能够使得训练过程更快收敛；

(2-2-2)初始化网络加性偏置参数，其中隐含层对应的偏置参数矩阵b₁为零矩阵，大小为hiddensize*1，输出层对应的偏置参数矩阵b₂为零矩阵，大小为visiblesize*1。

更佳地，所述的步骤(2-3)包括以下步骤：

(2-3-1)将第一子块Set 1样本集转化为一维向量作为稀疏自编码模型的输入，计算输出值：

其中s_l表示第l层的单元数目(不包含偏置项)。表示第l层第i个单元的输出值且f表示一非线性激活函数sigmoid函数且f(x)＝1/(1+e^-x)，且集合I{x¹,²,…,^m}表示第一子块Set>表示第层第l层第j个单元与第l+1层第i个单元之间的连接参数，表示第l+1层第i单元的偏置项，表示第l+1层第i单元输入加权和，该加权和包括偏置项。

(2-3-2)根据以下公式计算隐藏神经元j的平均激活度：

其中，a_j(x⁽ⁱ⁾)表示给定一个输入x⁽ⁱ⁾，自编码神经网络隐藏神经元j的激活度，进一步，表示隐藏神经元j的平均激活度。

根据以下公式计算惩罚因子使得平均激活度接近期望激活度ρ，ρ为稀疏性参数，接近于0，惩罚因子为：

根据以下公式计算稀疏自编码模型的损失函数：

其中h_W,b(x⁽ⁱ⁾)表示输入为x⁽ⁱ⁾时的输出，该输出包含参数W,b，y⁽ⁱ⁾表示输出值，y⁽ⁱ⁾＝x⁽ⁱ⁾；λ表示权重衰减系数；β表稀疏值惩罚项的权重；s_l表示第l层的单元数目，该单元数目不包含偏置项；

(2-3-3)使用梯度下降法更新稀疏自编码网络的权重参数和加性偏置参数，误差从网络的高层向底层反向传播，计算输出层，即第三层的每个输出单元i的残差：

其中，表示第l层的每个节点i的残差，

计算隐含层，即第二层的每个输出单元i的残差：

其中，稀疏自编码权重参数的更新公式为：

稀疏自编码偏置参数的更新公式为：

更佳地，所述的步骤(2-6)包括以下步骤：

(x₁,x₂,…,x_n)表示隐含层输出，表示初始的k个均值点，算法按照以下两个步骤循环交替进行，并且，这一算法将在对观测的分配不再变化时收敛，循环结束时的集合就是所需的码本：

(2-6-1)分配：将每个观测值x_p分配到聚类中

(2-6-2)更新：计算上一步得到聚类中每一聚类观测值的图心，作为新的均值点

继续步骤(2-6-1)。

较佳地，所述的步骤(3)包括以下步骤：

(3-1)对每一个查询笔迹样本或参考笔迹样本二值化图像，利用与权利要求3中大小相同的窗口提取足够多的子块，展开为一维长向量，作为稀疏自编码的输入；

(3-2)x₁,x₂,…,x_j表示稀疏自编码的输入，a₁,a₂,…,a_i表示隐含层的输出，n表示输入的个数，则，根据以下公式计算隐含层的输出：

f(x)＝1/(1+e^-x)，

(3-3)计算所述隐含层输出与码本k个中心之间的距离，将其归类为距离最近的那个中心，统计每个中心所得的频数，即为该笔迹样本的特征。

较佳地，所述的查询笔迹样本特征与参考笔迹样本特征之间的距离包括：

欧式距离，曼哈顿距离，加权欧式距离和加权曼哈顿距离，其中加权欧式距离和加权曼哈顿距离分别为：

其中，v₁和v₂代表两特征向量，v_1i和v_2i代表某一维度中的元素，σ_i表示第i维向量的方差。

采用了该发明中的基于稀疏自编码码本、离线文本无关的笔记鉴别方法，该方法无需对文本进行分割，并且码本鲁棒性强，该方法在实际应用中更加灵活、方便，具有更广泛的应用范围。

附图说明

图1为本发明的基于稀疏自编码码本实现笔迹鉴别的方法的流程图。

图2为本发明的稀疏自编码模型图以及权值可视化图。

图3为本发明的利用稀疏自编码提取码本的流程图。

具体实施方式

为了能够更清楚地描述本发明的技术内容，下面结合具体实施例来进行进一步的描述。

该计算机软件系统中基于稀疏自编码码本实现笔迹鉴别的系统，包括：

图像预处理模块，用以对查询笔迹样本和参考笔迹样本图像进行预处理，得到两者的二值化图像；

参数学习模块，用以根据稀疏自编码和k-means聚类方法来获得权重和码本的参数；

特征提取模块，用以根据权重和码本来提取查询笔迹样本和参考笔迹样本图像的特征；

距离计算模块，用以计算查询笔迹样本特征与参考笔迹样本特征之间的距离，并比较排序，最终获得查询笔迹样本书写者的候选列表。

还包括一种利用上述系统基于稀疏自编码码本实现笔迹鉴别的方法，包括以下步骤：

(1)对查询笔迹样本和参考笔迹样本图像进行预处理，得到两者的二值化图像；

(2)根据稀疏自编码和k-means聚类方法来获得权重和码本的参数；

(3)根据权重和码本来提取查询笔迹样本和参考笔迹样本图像的特征；

(4)计算查询笔迹样本特征与参考笔迹样本特征之间的距离，并比较排序，最终获得查询笔迹样本书写者的候选列表。

在一种较佳的实施方式中，所述的步骤(1)包括以下步骤：

(1-1)对所述灰度笔迹样本通过OTSU进行二值化，得到笔迹样本的二值化图像；

(1-2)对所述二值化图像进行去噪处理。

在一种较佳的实施方式中，所述步骤(2)包括以下步骤：

(2-2)采用稀疏自编码模型，将网络模型参数随机初始化；

(2-3)根据所述的第一子块Set 1样本集对稀疏自编码模型进行训练，得到权重参数；

(2-4)通过所述的窗口在每张参考笔迹样本的二值化图中随机选取一定数量的第二子块Set 2，该样本集数量需远大于第一子块Set 1；

(2-5)将所述的第二子块Set 2样本集作为稀疏自编码模型的前向输入，使用训练得到的权重参数，得到隐含层输出；

(2-6)对所述的隐含层输出采用k-means聚类算法，得到码本。

在一种更佳的实施方式中，所述的采用稀疏自编码模型为单隐含层的稀疏自编码模型或多隐含层的稀疏自编码模型。

在一种更佳的实施方式中，所述的将网络模型参数随机初始化，具体包括以下步骤：

(2-2-1)随机初始化网络权重参数，输入层和隐含层对应的权重参数矩阵W₁和隐含层和输出层对应的权重参数矩阵W₂为：

W₁＝rand(-r,r)_{hiddsnsize*visiblesize}，

W₂＝rand(-r,r)_{visiblesize*hiddensize}，

在一种更佳的实施方式中，所述的步骤(2-3)包括以下步骤：

(2-3-1)将第一子块Set 1样本集转化为一维向量作为稀疏自编码模型的输入，计算输出值：

其中s_l表示第l层的单元数目(不包含偏置项)。表示第l层第i个单元的输出值且f表示一非线性激活函数sigmoid函数且f(x)＝1/(1+e^-x)，且集合I＝{x¹,x²,…,x^m}表示第一子块Set>表示第层第l层第j个单元与第l+1层第i个单元之间的连接参数，表示第l+1层第i单元的偏置项，表示第l+1层第i单元输入加权和，该加权和包括偏置项。

(2-3-2)根据以下公式计算隐藏神经元j的平均激活度：

其中，a_j(x⁽ⁱ⁾)表示给定一个输入x⁽ⁱ⁾，自编码神经网络隐藏神经元j的激活度，进一步，表示隐藏神经元j的平均激活度。

根据以下公式计算惩罚因子使得平均激活度接近期望激活度ρ，ρ为稀疏性参数，接近于0，惩罚因子为：

根据以下公式计算稀疏自编码模型的损失函数：

其中，表示第l层的每个节点i的残差，

计算隐含层，即第二层的每个输出单元i的残差：

其中，稀疏自编码权重参数的更新公式为：

稀疏自编码偏置参数的更新公式为：

在一种更佳的实施方式中，所述的步骤(2-6)包括以下步骤：

(2-6-1)分配：将每个观测值x_p分配到聚类中

(2-6-2)更新：计算上一步得到聚类中每一聚类观测值的图心，作为新的均值点

继续步骤(2-6-1)。

在一种较佳的实施方式中，所述的步骤(3)包括以下步骤：

(3-2)x₁,x₂,…,x_j表示稀疏自编码的输入，a₁,a₂,…,a_i表示隐含层的输出，n表示输入的个数，则，根据以下公式计算隐含层的输出：

f(x)＝1/(1+e^-x)，

(3-3)计算所述隐含层输出与码本k个中心之间的距离，将其归类为距离最近的那个中心，统计每个中心所得的频数，即为该笔迹样本的特征。

在一种较佳的实施方式中，所述的查询笔迹样本特征与参考笔迹样本特征之间的距离包括：

欧式距离，曼哈顿距离，加权欧式距离和加权曼哈顿距离，其中加权欧式距离和加权曼哈顿距离分别为：

其中，v₁和v₂代表两特征向量，v_1i和v_2i代表某一维度中的元素，σ_i表示第i维向量的方差。

参见图1，为了实现上述目的，本发明的基于稀疏自编码码本的笔记鉴别系统包括：

图像预处理模块，用以对查询笔迹样本和参考笔迹样本图像进行预处理，得到两者的二值化图像；

参数学习模块，用以利用稀疏自编码和k-means聚类方法来获得权重和码本的参数；

特征提取模块，用以利用权重和码本来提取查询笔迹样本和参考笔迹样本图像的特征；

距离计算模块，计算查询笔迹样本特征与参考笔迹样本特征之间的距离，并比较排序，最终获得查询笔迹样本书写者的候选列表。

为了实现这种笔记鉴别方法，下面以一具体实施例详细描述。

首先，图像预处理模块；

101：收集多个笔迹样本，其中每位书写者均有两份内容不同的笔迹样本，一份作为参考笔迹样本，另一份作为查阅笔迹样本。

102：对所有的笔迹样本进行OTSU二值化，得到其二值化图像。

103：若笔迹样本中有噪声信息，比如其它非笔迹像素信息，包括花纹、图片、格线和印刷字符等等，可以采用连通域算法或者人工去除。

其次，参数学习模块；

201：设定一个固定大小的窗口，窗口越小，包含的信息越少，不利于提取笔迹特征；窗口越大，包含结构信息太多，同样妨碍提取笔迹特征，本发明对窗口大小从11*11到39*39情况均做了详细的实验，得到其首选和前10选的鉴别准确率。

确定窗口大小后，利用该窗口在所述每张参考笔迹样本二值化图中随机选取n个子块Set1，，作为训练稀疏自编码模型权重的样本集。

202：采用稀疏自编码模型，随机初始化网络模型参数。其中隐含层的个数在本实例中均定为75，输入层的个数则随窗口大小变化。

203：利用所述Set 1样本集对稀疏自编码模型进行训练，得到权重参数。本实例中稀疏性参数取0.1；权重衰减系数取3e-3；稀疏值惩罚项的权重取3。

204：利用所述窗口在每张参考笔迹样本二值化图中随机选取N个的子块Set 2，，在本实例中对N的大小做了详细的实验，得出N只需不小于3000，该方法就能得到很好地鉴别率的结论。

205：将所述Set 2样本集作为稀疏自编码模型的前向输入，使用训练得到的权重参数，得到隐含层输出。

206：对所述隐含层输出采用k-means聚类算法，得到码本。在本实例中，在每个笔迹样本特征中随机选取14个特征向量作为聚类中心，共取得聚类中心k大约4000个。

再次，特征提取模块；

301：对每一个查询笔迹样本或参考笔迹样本二值化图像，利用与权利要求3中大小相同的窗口提取N个子块，，展开为一维长向量，作为稀疏自编码的输入。

302：计算隐含层输出与码本k个中心之间的距离，将其归类为距离最近的那个中心，统计每个中心所得的频数，即为该笔迹样本的特征。

最后，距离计算模块；

401：计算查询笔迹样本特征与参考笔迹样本特征之间的距离，并比较排序，最终获得查询笔迹样本书写者的候选列表。所采用的距离计算方法有：欧式距离，曼哈顿距离，加权欧式距离，加权曼哈顿距离。

在此说明书中，本发明已参照其特定的实施例作了描述。但是，很显然仍可以作出各种修改和变换而不背离本发明的精神和范围。因此，说明书和附图应被认为是说明性的而非限制性的。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 基于稀疏自编码码本实现笔迹鉴别的系统及方法 [P] . 中国专利： CN106529490B . 2019.10.18
2. 基于稀疏自编码码本实现笔迹鉴别的系统及方法 [P] . 中国专利： CN106529490A . 2017-03-22
3. A method for transmitting feedback information in multi input multi output system based on codebook and a method for transmitting precoding information in multi input multi output system using codebook based precoding scheme [P] . 韩国专利： KR101349826B1 . 2014-01-09

机译：在基于码本的多输入多输出系统中传输反馈信息的方法和在基于码本的预编码方案中在多输入多输出系统中传输预编码信息的方法
4. Method for transmitting feedback information in multi input multi out put system based on codebook and a method for transmitting precoding information in multi input multi output system using codebook-bases precoding scheme [P] . 美国专利： US8432992B2 . 2013-04-30

机译：在基于码本的多输入多输出系统中传输反馈信息的方法和在基于码本的预编码方案的多输入多输出系统中传输预编码信息的方法
5. Fast sparse-algebraic-codebook search for efficient speech coding [P] . 美国专利： US5699482A . 1997-12-16

机译：快速稀疏代数码本搜索，实现高效语音编码