首页> 中国专利> 甲骨文识别方法、系统、装置和存储介质

甲骨文识别方法、系统、装置和存储介质

摘要

本发明公开一种甲骨文识别方法、系统、装置和存储介质,应用于甲骨文自动识别和深度学习领域,能较好地识别甲骨文,提高甲骨文识别效率和准确性。该方法包括:获取甲骨文数据集,将甲骨文数据集部分划分为训练集;通过生成对抗网络对训练集进行数据扩增得到训练数据扩增集;通过残差神经网络提取训练数据扩增集的第一特征数据;通过OpenCV提取训练数据扩增集的Gabor特征,卷积得第二特征数据;通过OpenCV提取训练数据扩增集的Hog特征,卷积得第三特征数据;对第一特征数据、第二特征数据和第三特征数据特征融合得第四特征数据;根据第四特征数据和注意力模型计算第五特征数据;将第五特征数据输入全连接层得甲骨文分类结果。

著录项

  • 公开/公告号CN115690478A

    专利类型发明专利

  • 公开/公告日2023-02-03

    原文格式PDF

  • 申请/专利权人 华南师范大学;

    申请/专利号CN202210258506.7

  • 申请日2022-03-16

  • 分类号G06V10/764;G06V10/80;G06V10/82;G06V10/50;G06N3/094;G06N3/045;G06N3/0475;G06N3/0464;

  • 代理机构广州嘉权专利商标事务所有限公司;

  • 代理人余凯欢

  • 地址 510631 广东省广州市天河区中山大道西55号华南师范大学计算机学院

  • 入库时间 2023-06-19 18:32:25

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-02-03

    公开

    发明专利申请公布

说明书

技术领域

本发明涉及甲骨文自动识别和深度学习技术领域,尤其涉及一种甲骨文识别方法、系统、装置和存储介质。

背景技术

甲骨文是汉字发展的关键形态。由于历史久远,甲骨文研究难度较大,目前甲骨文字的识别仍然主要依靠甲骨文专家、学者的人工处理。而通过人工对甲骨文字识别的效率较为低下。随着深度学习技术的发展,一些方案通过将深度神经网络应用到甲骨文的自动化识别中。相关技术中,大多直接采用迁移学习的方法识别甲骨文,对甲骨文是识别准确率较低,并且识别效率也不高。

发明内容

为了解决上述技术问题的至少之一,本发明提出一种甲骨文识别方法、系统、装置和存储介质,能够较好地识别甲骨文,有效提高识别甲骨文的效率和准确性。

一方面,本发明实施例提供了一种甲骨文识别方法,包括以下步骤:

获取甲骨文数据集,并将所述甲骨文数据集部分划分为训练集;

通过生成对抗网络对所述训练集进行数据扩增,得到训练数据扩增集;

根据所述训练数据扩增集,通过残差神经网络提取甲骨文图像的第一特征数据;

根据所述训练数据扩增集,通过OpenCV提取所述甲骨文图像的Gabor特征,将所述Gabor特征经过卷积操作得到所述甲骨文图像的第二特征数据;

根据所述训练数据扩增集,通过OpenCV提取所述甲骨文图像的Hog特征,将所述Hog特征经过卷积操作得到所述甲骨文图像的第三特征数据;

对所述第一特征数据、所述第二特征数据和所述第三特征数据进行特征融合,得到第四特征数据;

根据所述第四特征数据和注意力模型,计算得到第五特征数据;

将所述第五特征数据输入全连接层,得到甲骨文分类结果。

根据本发明实施例的一种甲骨文识别方法,至少具有如下有益效果:将获取的甲骨文数据集部分划分为训练集后,通过生成对抗网络对训练集进行数据扩增,得到训练数据扩增集,能够通过生成对抗网络对训练集数据进行数据扩增,从而使得到的训练数据扩增集的数据质量得到提高。另外,通过残差神经网络提取得到甲骨文的第一特征数据,通过OpenCV提取甲骨文的Gabor特征和Hog特征,并将甲骨文的Gabor特征输入卷积神经网络,提取甲骨文的第二特征数据,另外将甲骨文的Hog特征输入卷积神经网络,提取甲骨文的第三特征数据,然后将第一特征数据、第二特征数据和第三特征数据进行融合从而得到第四特征数据。通过将残差神经网络提取方法和卷积神经网络相结合,从而提高了对甲骨文的特征表达能力和分类效果。进一步地,将第四特征数据结合注意力模型,计算得到第五特征数据,通过注意力机制能够关注到第四特征数据中特征的关键部分,从而较好地识别甲骨文,有效地提高了识别甲骨文的效率以及准确性。

根据本发明的一些实施例,所述根据所述训练数据扩增集,通过OpenCV提取所述甲骨文图像的Gabor特征,包括:

根据所述训练数据扩增集,通过Gabor滤波器与所述甲骨文图像进行卷积,得到所述Gabor特征。

根据本发明的一些实施例,所述根据所述训练数据扩增集,通过OpenCV提取所述甲骨文图像的Hog特征,包括:

将所述训练数据扩增集进行归一化处理,得到归一化数据集;

计算所述归一化数据集的图像梯度值;

构建直方图;

根据所述直方图,将所述图像梯度值作为权重,对各个梯度方向在所述直方图中加权投影,得到所述直方图每个单元格的描述子;

将所述每个单元格的描述子进行组合,得到方向梯度直方图特征数据。

根据本发明的一些实施例,所述对所述第一特征数据、所述第二特征数据和所述第三特征数据进行特征融合,得到第四特征数据,包括:

对所述第二特征数据的特征维度进行转化,得到第二特征转化数据;其中,所述第二特征转化数据的高和宽与所述第一特征数据的高和宽相同;

对所述第三特征数据的特征维度进行转化,得到第三特征转化数据;其中,所述第三特征转化数据的高和宽与所述第一特征数据的高和宽相同;

通过增加通道,将所述第二特征转化数据、所述第三特征转化数据与所述第一特征数据拼接,得到第四特征数据。

根据本发明的一些实施例,所述注意力模型包括:通道注意力模型和空间注意力模型;

所述根据所述第四特征数据和注意力模型,计算得到第五特征数据,包括:将所述第四特征数据输入所述通道注意力模型,得到所述第四特征数据各个通道的对应权重值;

将所述第四特征数据各个通道的对应权重值与所述第四特征数据各个通道的特征图相乘,得到通道特征数据;

将所述第四特征数据输入所述空间注意力模型,得到空间注意力权重矩阵;

将所述空间注意力权重矩阵与所述第四特征数据相乘,得到空间特征数据;

根据所述通道特征数据和所述空间特征数据,得到第五特征数据。

根据本发明的一些实施例,所述通过生成对抗网络对所述训练集进行数据扩增,得到训练数据扩增集,包括:

根据循环生成对抗网络,对所述训练集进行数据扩增,得到训练数据扩增集。

根据本发明的一些实施例,所述全连接层包括:第一全连接层和第二全连接层;其中,所述第一全连接层的单元数为500,所述第二全连接层的单元数为所述训练集中甲骨文图像类别数量;

所述将所述第五特征数据通过全连接层,计算得到甲骨文分类结果,包括:

将所述第五特征数据依次通过第一全连接层以及第二全连接层,计算得到甲骨文分类结果。

另一方面,本发明实施例还提供了一种甲骨文识别系统,包括:

数据获取模块,用于获取甲骨文数据集,并将所述甲骨文数据集部分划分为训练集;

数据扩增模块,用于通过生成对抗网络对所述训练集进行数据扩增,得到训练数据扩增集;

第一特征提取模块,用于根据所述训练数据扩增集,通过残差神经网络提取甲骨文图像的第一特征数据;

第二特征提取模块,用于根据所述训练数据扩增集,通过OpenCV提取所述甲骨文图像的Gabor特征,将所述Gabor特征经过卷积操作得到所述甲骨文图像的第二特征数据;

第三特征提取模块,用于根据所述训练数据扩增集,通过OpenCV提取所述甲骨文图像的Hog特征,将所述Hog特征经过卷积操作得到所述甲骨文图像的第三特征数据;

特征融合模块,用于对所述第一特征数据、所述第二特征数据和所述第三特征数据进行特征融合,得到第四特征数据;

注意力模型处理模块,用于根据所述第四特征数据和注意力模型,计算得到第五特征数据;

全连接层模块,用于将所述第五特征数据输入全连接层,得到甲骨文分类结果。

另一方面,本发明实施例还提供了一种甲骨文识别装置,包括:

至少一个处理器;

至少一个存储器,用于存储至少一个程序;

当所述至少一个程序被所述至少一个处理器执行,使得至少一个所述处理器实现如上述实施例所述的甲骨文识别方法。

另一方面,本发明实施例还提供了一种计算机存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由所述处理器执行时用于实现如上述实施例所述的甲骨文识别方法。

附图说明

图1是本发明实施例提供的甲骨文识别方法流程图;

图2是本发明实施例提供的甲骨文识别装置原理框图。

具体实施方式

本申请实施例所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。

在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。

除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。

甲骨文是汉字发展的一种关键形态。因此,甲骨文的潜在价值是巨大的。但是,由于甲骨文的历史较为久远,使得甲骨文研究的门槛较高,认读难度相当大。目前,甲骨文的识别仍主要以甲骨文专家、学者的人工处理为主,但是依赖人工处理的方法识别效率低下。随着深度学习技术的发展,一些深度神经网络被应用到甲骨文的自动化识别中。而相关技术中,大多直接采用迁移学习的方法识别甲骨文,对甲骨文是识别准确率较低,并且识别效率也不高。

基于此,本发明实施例提供一种甲骨文识别方法,能够较好地识别甲骨文,有效提高识别甲骨文的效率和准确性。参照图1,本发明实施例的方法包括但不限于步骤S110、步骤S120、步骤S130、步骤S140、步骤S150、步骤S160、步骤S170和步骤S180。

具体地,本实施例的方法包括以下步骤:

S110:获取甲骨文数据集,并将甲骨文数据集部分划分为训练集。

S120:通过生成对抗网络对训练集进行数据扩增,得到训练数据扩增集。

S130:根据训练数据扩增集,通过残差神经网络提取甲骨文图像的第一特征数据。

S140:根据训练数据扩增集,通过OpenCV提取甲骨文图像的Gabor特征,将Gabor特征经过卷积操作得到甲骨文图像的第二特征数据。

S150:根据训练数据扩增集,通过OpenCV提取甲骨文图像的Hog特征,将Hog特征经过卷积操作得到甲骨文图像的第三特征数据。

S160:对第一特征数据、第二特征数据和第三特征数据进行特征融合,得到第四特征数据。

S170:根据第四特征数据和注意力模型,计算得到第五特征数据。

S180:将第五特征数据输入全连接层,得到甲骨文分类结果。

在本具体实施例工作过程中,首先获取甲骨文数据集,并将甲骨文数据集部分划分为训练集。具体地,本实施例是从甲骨文大数据平台上获取甲骨文数据集,例如“殷契文渊”的OBC306数据集,该数据集的图像来源于《甲骨文字合集》、《甲骨文字合集补编》与《怀特氏等收藏甲骨文集》等。进一步地,本实施例将获取到的甲骨文数据集部分划分为训练集。示例性地,在OBC306甲骨文数据集的306类甲骨文字中,将每一类甲骨文字按8:1:1的比例划分为训练集、测试集和验证集,在训练集上训练甲骨文识别模型,在测试集上测试甲骨文识别模型的效果,并通过验证集及时调整甲骨文识别模型。然后通过生成对抗网络对训练集进行数据扩增,得到训练数据扩增集。在划分后的训练集中,甲骨文字中样本数量在每个类中的数量分布严重不均匀,呈现出长尾效应,不利于神经网络的训练。因此,本实施例需要对训练集进行数据扩增,例如,通过生成对抗网络对训练集进行数据扩增,从而缓解甲骨文字中样本数量在每个类中的数量分布严重不均匀的问题。进一步地,本实施例根据训练数据扩增集,通过残差神经网络提取甲骨文的第一特征数据;同时,通过OpenCV提取训练数据扩增集的甲骨文图像的Gabor特征和Hog特征后,分别将甲骨文图像的Gabor特征和Hog特征输入到卷积神经网络,得到Gabor特征对应的第二特征数据和Hog特征对应的第三特征数据,再将第一特征数据、第二特征数据和第三特征数据进行特征融合,得到第四特征数据,以通过传统提取特征方法和自动提取特征的卷积神经网络相结合,来进行甲骨文的特征融合方式,提高了甲骨文识别模型的表达能力和分类效果。然后根据融合得到的第四特征数据和注意力模型,计算得到第五特征数据。本实施例通过将第一特征数据、第二特征数据和第三特征数据融合得到的第四特征数据结合注意力模型,能够使得识别网络更加关注第四特征数据重要的特征,进一步提高第一特征数据、第二特征数据和第三特征数据融合的效果。进一步地,本实施例将第五特征数据输入全连接层,从而得到甲骨文分类结果。

在本具体实施例中,本实施例通过生成对抗网络对训练集进行数据扩增,缓解了划分得到的甲骨文训练集的甲骨文字样本数量在每个类中的数量分布不均匀而导致不利于神经网络训练的问题。另外,本实施例通过残差神经网络对训练数据扩增集进行特征提取,得到第一特征数据。然后通过OpenCV分别提取甲骨文图像的Gabor特征和Hog特征,并将Gabor特征和Hog特征分别输入卷积神经网络进行进一步的特征提取,得到Gabor特征对应的第二特征数据和Hog特征对应的第三特征数据。进一步地,将第一特征数据、第二特征数据和第三特征数据进行特征融合,从而得到结合残差神经网络和卷积神经网络的第四特征数据。本实施例通过将残差神经网络和卷积神经网络提取得到的特征数据相融合,从而提高了甲骨文识别模型的表达能力和分类水平。进一步地,本实施例通过将第四特征数据输入注意力模型,从而计算得到第五特征数据。本实施例通过注意力模型,能够进一步提取第四特征数据中的重要特征,从而进一步提高第一特征数据、第二特征数据和第三特征数据融合效果,有效提高甲骨文字的识别效果。然后,本实施例通过将第五特征数据输入全连接层,得到甲骨文分类结果,实现较好地识别甲骨文,有效提高识别甲骨文的效率和准确性。

在本发明的一些实施例中,根据训练数据扩增集,通过OpenCV提取甲骨文图像的Gabor特征,包括但不限于以下步骤:

根据训练数据扩增集,通过Gabor滤波器与甲骨文图像进行卷积,得到Gabor特征。

在本具体实施例中,本实施例通过生成对抗网络对训练集进行数据扩增,得到训练数据扩增集。然后根据训练数据扩增集,通过OpenCV分别提取甲骨文的纹理特征(Gabor特征)。具体地,本实施例通过Gabor滤波器与训练数据扩增集的图像进行卷积的方式,从而提取得到相应的纹理特征。在本实施例通过OpenCV对训练数据扩增集进行纹理特征数据提取过程中,Gabor小波在提取目标的局部空间和频域信息方面表现出较好的性能,对于图像的边缘敏感,从而提供良好的方向选择和尺度选择特性,并且对于光照变化不敏感,因此能够提供对光照变化良好的适应性。另外,Gabor小波还能够容忍一定程度的图像旋转和变形。在空间域中,一个二维的Gabor滤波器是一个正弦平面波和高斯核函数的乘积。具体地,二维Gabor函数的数学表达式如下式(1)所示:

其中,式(1)中的x’如下式(2)所示,式(1)中的y’如下式(3)所示:

x’=x cosθ+y sinθ (2)

y’=-x sinθ+y cosθ (3)

其中,λ为正弦函数的波长,θ为核函数方向,

实际上,本实施例通过OpenCV对训练数据扩增集进行纹理特征提取过程是Gabor滤波器与甲骨文图像进行卷积的过程,经过卷积计算后得到的纹理特征数据F如下式(4)所示:

在本发明的一些实施例中,根据所述训练数据扩增集,通过OpenCV提取所述甲骨文图像的Hog特征,包括但不限于以下步骤:

将训练数据扩增集进行归一化处理,得到归一化数据集。

计算归一化数据集的图像梯度值。

构建直方图。

根据直方图,将图像梯度值作为权重,对各个梯度方向在直方图中加权投影,得到直方图每个单元格的描述子。

将每个单元格的描述子进行组合,得到方向梯度直方图特征数据。

在本具体实施例中,本实施例通过OpenCV提取甲骨文的方向梯度直方图特征(Hog特征)时,先将训练数据扩增集进行归一化处理,得到归一化数据集,并计算归一化数据集的图像梯度值。然后构建直方图,根据直方图将图像梯度值作为权重,对各个梯度方向在直方图中进行加权投影,得到直方图每个单元格的描述子,从而通过将每个单元格的描述子进行组合的方式,得到方向梯度直方图特征数据。具体地,本实施例首先对训练数据扩增集的甲骨文图像进行归一化处理,得到归一化数据集,其中包括颜色空间和gamma空间归一化。将甲骨文图像转换为灰度图像,归一化gamma压缩公式如下式(5)所示:

I(x,y)=I(x,y)

其中,I表示输入的图像,gamma表示自行设定的数值。

进一步地,本实施例通过计算归一化数据集中甲骨文图像横坐标和纵坐标方向的梯度,并根据横坐标和纵坐标方向的梯度,计算梯度方向,如下式(6)和(7)所示:

G

G

其中,G

进一步地,构建直方图。示例性地,构造8*8像素大小的单元格,并统计9个BIN的直方图对单元格内的梯度信息,将像素的梯度作为权重,对各个梯度方向在直方图中加权投影,从而形成每个单元的描述子。由于通过归一化单元块能够弱化局部变化对梯度值产生的影响,因此将所有的块组合起来从而生成甲骨文的Hog特征,即将每个单元格的描述子进行组合,从而得到方向梯度直方图特征数据。

根据本发明的一些实施例,对所述第一特征数据、第二特征数据和第三特征数据进行特征融合,得到第四特征数据,包括但不限于以下步骤:

对第二特征数据的特征维度进行转化,得到第二特征转化数据。其中,第二特征转化数据的高和宽与第一特征数据的高和宽相同。

对第三特征数据的特征维度进行转化,得到第三特征转化数据;其中,第三特征转化数据的高和宽与第一特征数据的高和宽相同。

通过增加通道,将第二特征转化数据、第三特征转化数据与第一特征数据拼接,得到第四特征数据。

在本具体实施例中,本实施例首先通过卷积操作将提取得到的第二特征数据和第三特征数据的特征维度进行转化,使得第二特征数据和第三特征数据的高和宽均与第一特征数据的高和宽相同,从而得到第二特征转化数据和第三特征转化数据。进一步地,以通过增加通道的方式,将第二特征转化数据、第三特征转化数据和第一特征数据进行拼接,从而融合得到第四特征数据。本实施例通过将第二特征数据和第三特征数据的高和宽进行转化,使转化后得到的第二特征转化数据和第三特征转化数据与第一特征数据的高和宽均相同,从而能够以通过增加通道的方式将第二特征转化数据、第三特征转化数据与第一特征数据进行融合,得到融合后的新特征,即第四特征数据。本实施例通过将第一特征数据、第二特征数据和第三特征数据相融合得到第四特征数据,能够有效提高甲骨文字的识别效率和识别效果。

在本发明的一些实施例中,注意力模型包括通道注意力模型和空间注意力模型。相应地,根据第四特征数据和注意力模型,计算得到第五特征数据,包括但不限于以下步骤:

将第四特征数据输入通道注意力模型,得到第四特征数据各个通道的对应权重值。

将第四特征数据各个通道的对应权重值与第四特征数据各个通道的特征图相乘,得到通道特征数据。

将第四特征数据输入空间注意力模型,得到空间注意力权重矩阵。

将空间注意力权重矩阵与第四特征数据相乘,得到空间特征数据。

根据所述通道特征数据和所述空间特征数据,得到第五特征数据。

在本具体实施例中,注意力模型能够使得甲骨文识别模型更关注重要的特征。其中,注意力模型包括通道注意力模型和空间注意力模型。本实施例先将第四特征数据输入通道注意力模型,得到第四特征数据各个通道的对应权重值,然后将第四特征数据各个通道的对应权重值与第四特征数据各个通道的特征图相乘,得到通道特征数据。具体地,通道注意力模型通过计算出第四特征数据各个通道对应的权重值,再通过权重值与相应通道的特征图相乘,从而将重要特征的表示进行突出,得到通道特征数据。通道注意力模型对输入的第四特征数据的特征图分别进行最大池化核平均池化,从而将特征图降维成两个向量,再分别将两个向量送入感知机(MLP)中进行信息,其中,这两个向量共享一组权重值。感知机中输出的向量相加后输入sigmod函数中进行能激活。权重向量的计算如下式(10)所示:

其中,F∈R

进一步地,本实施例通过将第四特征数据输入空间注意力模型,以得到空间注意力权重矩阵。然后,再将空间注意力权重矩阵与第四特征数据相乘,得到空间特征数据。具体地,空间注意力模型中也需要计算出一个权重矩阵,并用权重矩阵与该层特征图相乘得到下一层的输入。其中,空间注意力模型的权重矩阵是基于空间关系计算的。通过将第四特征数据输入空间注意力模型,从而得到空间注意力权重矩阵,然后将空间注意力权重矩阵与第四特征数据中该层对应的特征图相乘,从而得到空间特征数据。空间注意力模型分别在通道分析上对输入的特征图进行最大池化和平均池化,并在通道方向对两个输出做concat连接。其中,f

其中,

根据本发明的一些实施例,通过生成对抗网络对训练集进行数据扩增,得到训练数据扩增集,包括但不限于以下步骤:

根据循环生成对抗网络,对训练集进行数据扩增,得到训练数据扩增集。

在本具体实施例中,本实施例通过循环生成对抗网络(CycleGan)对训练集进行数据扩增的方式,来得到训练数据扩增集。示例性地,首先本实施例将无噪声的甲骨文字模图谱转化为和真实拓片图片一样存在噪声的拓片图片。由于OBC306数据集和HWOBC数据集的甲骨文字符在空间上没有完全对应,导致无法构成配对图像。因此通过循环生成对抗网络,合成拓片风格的甲骨文字符,即通过循环生成对抗网络对训练集的甲骨文图像进行数据扩增,从而得到训练数据扩增集。具体地,循环生成对抗网络包括两个生成器G和F、两个判别器D

需要说明的是,OBC306数据集的训练集样本平均数量为650,使用循环生成对抗网络对OBC306训练集中样本数量小于650的类别进行扩充,使其训练数据扩充至650张,而其他数据均不进行扩充。HWOBC的图片数量有限,需对字模图片进行随机仿射变换、随机翻转、加入随机噪声等处理,从而获得扩充的大量的甲骨文字符图像。在HWOBC数据集和OBC306数据集上对循环生成对抗网络进行训练,迭代次数为100。通过图片处理操作,来获得足够数量的字模图片,再使用训练完成的循环生成对抗网络对处理过的字模图片进行风格迁移,最终得到足够数量的生成拓片图片,即得到训练数据扩增集。

在本发明的一些实施例中,全连接层包括:第一全连接层和第二全连接层。其中,第一全连接层的单元数为500,第二全连接层的单元数为训练集中甲骨文图像类别数量。相应地,将第五特征数据通过全连接层,计算得到甲骨文分类结果,包括但不限于以下步骤:

将第五特征数据依次通过第一全连接层以及第二全连接层,计算得到甲骨文分类结果。

在本具体实施例中,本实施例通过第四特征数据和注意力模型,计算得到第五特征数据后,再将第五特征数据通过全连接层,以计算得到甲骨文的分类结果。具体地,全连接层包括第一全连接层和第二全连接层。通过将第五特征数据依次通过第一全连接层和第二全连接层,从而得到甲骨文分类结果。其中,第一全连接层的单元数为500,而第二全连接层的单元数与训练集中甲骨文图像类别数量一致,例如,在OBC306甲骨文数据集中有306类的甲骨文字,则训练集中甲骨文图像类别数量为306,因此第二全连接层的单元数为306。

本发明的一个实施例还提供了一种甲骨文识别系统,包括:

数据获取模块,用于获取甲骨文数据集,并将甲骨文数据集部分划分为训练集;

数据扩增模块,用于通过生成对抗网络对训练集进行数据扩增,得到训练数据扩增集;

第一特征提取模块,用于根据训练数据扩增集,通过残差神经网络提取甲骨文图像的第一特征数据;

第二特征提取模块,用于根据训练数据扩增集,通过OpenCV提取甲骨文图像的Gabor特征,将Gabor特征经过卷积操作得到甲骨文图像的第二特征数据;

第三特征提取模块,用于根据训练数据扩增集,通过OpenCV提取甲骨文图像的Hog特征,将Hog特征经过卷积操作得到甲骨文图像的第三特征数据;

特征融合模块,用于对第一特征数据、第二特征数据和第三特征数据进行特征融合,得到第四特征数据;

注意力模型处理模块,用于根据第四特征数据和注意力模型,计算得到第五特征数据;

全连接层模块,用于将第五特征数据输入全连接层,得到甲骨文分类结果。

参照图2,本发明的一个实施例还提供了一种甲骨文识别装置,包括:

至少一个处理器210;

至少一个存储器220,用于存储至少一个程序;

当所述至少一个程序被所述至少一个处理器210执行,使得至少一个所述处理器210实现如上述具体实施例描述的甲骨文识别方法。

本发明的一个实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个控制处理器执行,例如,执行以上实施例描述的步骤。

本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。

以上是对本发明的较佳实施进行了具体说明,但本发明并不局限于上述实施方式,熟悉本领域的技术人员在不违背本发明精神的前提下还可作出种种的等同变形或替换,这些等同的变形或替换均包含在本发明权利要求所限定的范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号