首页> 中国专利> 一种汉字书写形态美观度的计算机评估方法

一种汉字书写形态美观度的计算机评估方法

摘要

本发明公开了一种汉字书写形态美观度的计算机评估方法。方法基于对人工给定的汉字书写样本的美观度评分进行机器学习而得。首先对汉字书写形态进行笔划分解与参数化,然后使用图像处理和人工智能的方法获得汉字书写形态与其美观度间的潜在关系。在第一步笔划分解与参数化过程中引入用户智能交互,提高了对潦草字迹的处理能力。在第二步学习字体形态与人工评分间关系的过程中,分别开展对汉字书写形态中每个单独笔划、字体内各部分的空间结构、以及字体内各部分的书写风格一致性进行美观度评分;最后综合上述评分结果,给出该汉字书写形态整体美观度的评分。该方法的优点是可由计算机自动执行。

著录项

  • 公开/公告号CN101295371A

    专利类型发明专利

  • 公开/公告日2008-10-29

    原文格式PDF

  • 申请/专利权人 浙江大学;

    申请/专利号CN200810060767.8

  • 发明设计人 徐颂华;江浩;刘智满;潘云鹤;

    申请日2008-04-18

  • 分类号G06N1/00(20060101);G06T7/40(20060101);G06K9/64(20060101);

  • 代理机构33200 杭州求是专利事务所有限公司;

  • 代理人张法高

  • 地址 310027 浙江省杭州市浙大路38号

  • 入库时间 2023-12-17 20:53:53

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2011-06-22

    未缴年费专利权终止 IPC(主分类):G06N1/00 授权公告日:20100120 终止日期:20100418 申请日:20080418

    专利权的终止

  • 2010-01-20

    授权

    授权

  • 2008-12-24

    实质审查的生效

    实质审查的生效

  • 2008-10-29

    公开

    公开

说明书

技术领域

本发明涉及计算机艺术与美学以及人工智能领域,尤其涉及一种汉字美观度的计算机评估方法。

背景技术

已经有大量的工作来模拟人类的艺术思维,并进一步建立计算机智能系统以解决真实世界里的问题。在中文字方面,1995年的Proceedings of theInternational Conference on Computer Processing of Oriental Languages(ICCPOL)会议论文集(文章标题“Chinese glyph generation using character composition andbeauty evaluation metrics”)公布了一个使用启发式的方法来尝试定量评估中文字体美感的问题:他们定义了在汉字写作里的四条规则,并实现到了他们基于规则的美学评分模块中;这一模块简单地对四条规则逐一计算相应的分数,并得到他们的加权和。2005年的IEEE Intelligent Systems杂志(文章标题“Automaticgeneration of artistic Chinese calligraphy”,以下简称文献IS2005)刊登了一个中国艺术书法的自动生成系统。但是,他们的工作主要关注在使用基于约束的推理来生成格式化的中文字体,而几乎没有关注到这些生成结果如何具有美感。

为了获得更好的计算机中文字体生成结果,也为了尝试对美学做定量计算,我们通过学习基本数值关系背后的训练集从而实现了汉字美观度评分。许多在工作中使用过专家系统的人知道,高级的专家规则并不总能正常工作;而有时这并不一定是由于专家系统本身的知识盲点,或者问题根本无法总结。因此我们觉得,我们基于学习技术的数据驱动方法可以提供一种比人类专家的大脑评测更好的机器评价能力。

在绘画方面,计算机图形学领域中同样有一些研究自动绘画创作的工作,但这大都是在给定一幅照片的基础上完成的。其他也有人探索了结合人工智能和人机交互技术来创作绘画风格的动画,如2006年ACM学报ACM Trans.Graph刊登的文章“Animating Chinese paintings through stroke-based decomposition”用笔划分解的方法来实现动态的绘画。在视觉艺术领域之外,计算机音乐是另一个应用人工智能技术来进行或协助创作的成功方向。在2007年的国际人工智能联合大会(IJCAI2007)上,有一个独立的专题叫音乐人工智能(MUSIC-AI2007)来专门研讨这一话题。值得注意的是,对于计算机音乐的研究包括自动音乐创作与音乐评价,这与我们在中文字体上的思路比较相似。此外还有其他大量的研究工作:如故事创作,可信执法官,互动式故事,等等,都旨在捕捉美学的可计算性。

发明内容

本发明的目的是提供一种汉字美观度的计算机评估方法,用一个基于机器学习算法的机制,首先对一部分由人类评委给定美观度评分的汉字样本字体进行学习,分析出每个字体的参数化信息,然后使用图像处理和人工智能的方法来获得字体形态与其美观度之间的潜在关系,进而可以对汉字字体的美观度做评分。

汉字美观度的计算机评估方法包括如下步骤:

1)通过多人调查的方式为500~2000个汉字单笔划的笔划样本评分,并使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体单笔划形态与其美观度评价结果间的映射关系,然后使用训练后的学习器对字体单笔划美观度进行评分;

2)通过多人调查的方式为500~2000个汉字样本的内部结构评分,并使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体内部结构特征与其美观度评价结果间的映射关系,然后使用训练后的学习器对字体内部结构进行评分,其中,字体内部结构包括字体各内部笔划或偏旁部首元素间的拓扑关系、相对位置关系、面积遮盖关系,以及笔划与笔划、笔划与偏旁部首之间的空间位置关系与该字的标准字体的差异,实现对字体内的各部分空间结构分布的美观度评分;

3)通过多人调查的方式为100~300个汉字样本的风格一致性评分,并使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体风格一致性特征与其美观度评价结果间的映射关系,使用训练后的学习器对字体风格一致性进行评分;对字体各个内部笔划或偏旁部首元素计算出与该字多种已知风格字体的相似度,并以此确定该字体的风格一致性评分;

4)根据对汉字进行的单笔划美观度评分、内部结构美观度评分、风格一致性评分,应用统计学习方法综合各项得分,获得该字体的总体美观度评分。

所述的一种汉字美观度的计算机评估方法,其特征在于所述的通过多人调查的方式为500~2000个汉字单笔划的笔划样本评分,并使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体单笔划形态与其美观度评价结果间的映射关系,然后使用训练后的学习器对字体单笔划美观度进行评分方法包括如下步骤:

a)事先通过多人调查方式,让六人各自对来自100个汉字的单笔划图像做评分,评分结果为“好”、“一般”、“差”三种其中之一;综合所有人的评分结果,计算该笔划的分数概率,即:分别统计将笔划评分为“好”、“一般”、“差”的人数,除以总人数,所得三个百分数分别为该笔划美观度为“好”、“一般”、“差”的概率,获得500~2000个单笔划的美观度的人工评价结果;

b)将步骤a)中所述各笔划的楷书体图像作为该笔划的标准笔划;将这些单笔划图像参数化,即提取出它们的轮廓、轨迹、位置信号,转换成向量的形式,对这些向量进行预处理,去除噪音,并进一步抽取特征向量,对获得的特征向量,与该笔划的标准笔划的特征向量作向量减法,从而得到单笔划的形态差异向量;

c)使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得单笔划的形态差异向量中的信号差异与美观度评价结果间的函数映射关系;即以形态差异向量与美观度评价结果分别作为人工神经网络、决策树、模糊逻辑或支持向量机的输入和输出;应用步骤a)中的人工评价结果,对人工神经网络或决策树或模糊逻辑或支持向量机施行带有反馈的机器学习过程;

d)使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机对单笔划进行评分:即对任意给定的单笔划图像,应用步骤b)得到该笔划与其标准笔划间的形态差异向量,以该向量作为训练后的人工神经网络或决策树或模糊逻辑或支持向量机的输入,获取此时的输出,即为该汉字笔划的美观度得分。

所述的一种汉字美观度的计算机评估方法,其特征在于所述的通过多人调查的方式为500~2000个汉字样本的内部结构评分,并使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体内部结构特征与其美观度评价结果间的映射关系,然后使用训练后的学习器对字体内部结构进行评分,其中,字体内部结构包括字体各内部笔划或偏旁部首元素间的拓扑关系、相对位置关系、面积遮盖关系,以及笔划与笔划、笔划与偏旁部首之间的空间位置关系与该字的标准字体的差异,实现对字体内的各部分空间结构分布的美观度评分方法,包括以下步骤:

e)事先通过多人调查方式,事先通过多人调查方式,让六人分别对汉字图像做评分,评分结果为“好”、“一般”、“差”三种其中之一;综合所有人的评分结果,计算该字体的分数概率,即:分别统计将字体评分为“好”、“一般”、“差”的人数,除以总人数,所得百分数分别为该字体分数为“好”、“一般”、“差”的概率;通过这样的方式获得500~2000个字体空间结构美观度的人工评价结果;

f)通过笔划分解结果将该字体参数化,转换成向量的形式;这些向量层次化的表达了字体的轮廓、轨迹与相对位置信息;

g)将步骤e)中所述各字体的楷书体图像作为该字体的标准字体;提取出这些字体所对应向量中,各笔划或偏旁部首间的拓扑、几何关系的信号,与其标准字体的拓扑、几何关系的信号做比较,获得其信号差异,即做向量减法;

h)使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得向量信号差异与美观度评价结果间的映射关系;应用步骤e)中人工标定的评价结果,对人工神经网络、决策树、模糊逻辑或支持向量机施行带有反馈的迭代学习过程。

i)使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机对字体空间结构美观度进行评分。即对任意给定的字体图像,应用步骤f)-步骤g)得到该字体内部结构与该字的标准字体间的信号差异,以该差异向量作为训练后的人工神经网络或决策树或模糊逻辑或支持向量机的输入,获取此时的输出,即为该字体的内部结构美观度得分。

所述的一种汉字美观度的计算机评估方法,其特征在于所述的通过多人调查的方式为100~300个汉字样本的风格一致性评分,并使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体风格一致性特征与其美观度评价结果间的映射关系,使用训练后的学习器对字体风格一致性进行评分;对字体各个内部笔划或偏旁部首元素计算出与该字多种已知风格字体的相似度,并以此确定该字体的风格一致性评分的方法包括如下步骤:

j)事先通过多人调查方式,让多个人分别对多个汉字图像的风格一致性做评分,评分结果为“好”、“一般”、“差”三种其中之一;综合所有人的评分结果,计算该字体的分数概率,即:分别统计将该字评分为“好”、“一般”、“差”的人数,分别将其除以总人数,所得百分数分别为该该字分数为“好”、“一般”、“差”的概率;通过这样的方式获得100~300个汉字字体风格一致性的人工评价结果;

k)准备好这些汉字对应的楷书体、行书体及隶书体中的书写形态样本,或更多其他字体,作为已知字体;

l)通过笔划分解结果将以上字体参数化,转换成向量的形式;这些向量层次化的表达了字体的轮廓、轨迹与相对位置信息;

m)对各字体的每个部分,计算出该部分与其各种已知字体该部分的相似程度;单笔划Ai与已知字体Bj的相似度Sij的计算方法可以任选以下两种之一:

(1)以已知字体Bj作为单笔划Ai的标准笔划,使用单笔划美观度评分方法计算出该笔划美观度的三个概率值P1,P2,P3,分别表示该笔划美观度为“好”、“一般”、“差”的概率;在本实施例中,Sij=P1×50%+P2×50%;

(2)求出笔划Ai的范围矩形,即能包含该笔划所有部分的矩形中的最小矩形,并通过不断平移和绕范围矩形中心旋转Ai,使Ai的字迹与其字体Bj相应笔划的字迹的重合面积最大;设Ai的字迹面积为C1,其字体Bj相应笔划的字迹的面积为C2,则Sij=|C1∩C2|/|C1∪C2|,及相似程度为C1、C2交集面积与C1、C2并集面积的比值;

n)将字体每个部分与每种已知字体的相似程度聚合可得到一个矩阵,作为该字体的风格一致性特征;

o)使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得该矩阵与美观度评价结果间的映射关系;应用人工标定的评价结果,对人工神经网络、决策树、模糊逻辑或支持向量机施行带有反馈的迭代学习过程;

p)使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机对字体风格一致性进行评分。即对任意给定的字体图像,应用步骤k)-步骤n)得到该字体与各已知字体间的相似度,以该矩阵作为训练后的人工神经网络或决策树或模糊逻辑或支持向量机的输入,获取此时的输出,即为该字体的风格一致性得分。

所述的一种汉字美观度的计算机评估方法,其特征在于所述的根据对汉字进行的单笔划美观度评分、内部结构美观度评分、风格一致性评分,应用统计学习方法综合各项得分,获得该字体的总体美观度评分的方法包括如下步骤:

q)利用上述三个方法,使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机自动获得100~300个汉字的各单笔划美观度得分、内部结构美观度得分和字体风格一致性得分;

r)通过多人调查方式,让多个人分别对步骤q)中所述汉字图像做美观度总体评分,评分结果为“好”、“一般”、“差”三种其中之一;综合所有人的评分结果,计算该字体的分数概率,即:分别统计将字体评分为“好”、“一般”、“差”的人数,分别将其除以总人数,所得百分数分别为该字体分数为“好”、“一般”、“差”的概率;

s)使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得步骤q)中的得分与步骤r)中的美观度总体评分间的映射关系;应用人工标定的评价结果,对人工神经网络、决策树、模糊逻辑或支持向量机施行带有反馈的迭代学习过程;

t)使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机对字体的总体美观度进行评分,即对任意给定的汉字字体图像,应用步骤q)的方法得到该字体的单笔划美观度得分、内部结构美观度得分和字体风格一致性得分,并以这些得分作为训练后的人工神经网络或决策树或模糊逻辑或支持向量机的输入,获取此时的输出,即为该字体的总体美观度得分。

本发明与现有技术相比具有的有益效果:

(1)综合了多种人工智能与图像处理技术,使得计算机对汉字的美观度评价成为可能;

(2)利用了一种机器学习的机制,使得计算机对汉字的美观度评价能力可以从人类的审美观学习而来;

(3)在对汉字的笔划分解中,引入了用户的交互式输入,大大提高了形变严重的字体尤其是草书体的笔划分解效果。

附图说明

图1是本发明所述实施例系统的流程图;

图2是本发明所述美观度评分算法的各部分评分算法的示意图;

图3(a)是汉字样本字体;

图3(b)是图3(a)中字体的细化结果;

图3(c)是图3(a)中字体的“几何图”;

图4是本发明所述笔划分解及汉字参数化的流程示例图;

图4(a)为汉字样本字体;

图4(b)为图4(a)的“几何图”;

图4(c)为图4(a)的对应标准字体,即正楷字体;

图4(d)为图4(a)在骨架上的笔划分解结果;

图4(e)为图4(a)的最终笔划分解结果;

图5是本发明所述利用用户交互界面协助笔划分解及汉字参数化的流程示例图;

图5(a)为汉字样本字体;

图5(b)为图5(a)的“几何图”;

图5(c)为图5(a)的标准字体,即正楷字体;

图5(d)为图5(a)的自动分解结果,彩色笔划表示在自动分解成功的笔划;

图5(e)为用户通过交互界面在字体上勾勒的剩余笔划草图;

图5(f)为根据用户草图得到的骨架上的笔划匹配结果;

图5(g)为综合图5(d)和图5(f)所示结果后的笔划骨架;

图5(h)为图5(a)的最终笔划分解结果;

图6为单笔划评分方法中所用到的笔划特征信号;

图7为汉字书写形态评分的一个示例,该字的五个单笔划如图8(a)-(e)所示;该字的空间结构分布美观度评分为:(82.5%好、17.1%一般、0.4%差),其风格一致性评分为:(26.8%好、51.1%一般、22.1%差),其总体美观度评分为:(35.2%好、49.7%一般、15.1%差);

图8(a)为图7所示汉字的第1笔划,其单笔划美观度评分为:(56.0%好、44.0%一般、0%差);

图8(b)为图7所示汉字的第2笔划;其单笔划美观度评分为:(84.7%好、15.3%一般、0%差);

图8(c)为图7所示汉字的第3笔划;其单笔划美观度评分为:(34.8%好、54.6%一般、10.6%差);

图8(d)为图7所示汉字的第4笔划;其单笔划美观度评分为:(12.7%好、46.9%一般、40.4%差);

图8(e)为图7所示汉字的第5笔划。其单笔划美观度评分为:(9.2%好、37.5%一般、63.3%差)。

具体实施方式

汉字美观度的计算机评估方法包括如下步骤:

1)通过多人调查的方式为500~2000个汉字单笔划的笔划样本评分,并使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体单笔划形态与其美观度评价结果间的映射关系,然后使用训练后的学习器对字体单笔划美观度进行评分;

2)通过多人调查的方式为500~2000个汉字样本的内部结构评分,并使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体内部结构特征与其美观度评价结果间的映射关系,然后使用训练后的学习器对字体内部结构进行评分,其中,字体内部结构包括字体各内部笔划或偏旁部首元素间的拓扑关系、相对位置关系、面积遮盖关系,以及笔划与笔划、笔划与偏旁部首之间的空间位置关系与该字的标准字体的差异,实现对字体内的各部分空间结构分布的美观度评分;

3)通过多人调查的方式为100~300个汉字样本的风格一致性评分,并使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体风格一致性特征与其美观度评价结果间的映射关系,使用训练后的学习器对字体风格一致性进行评分;对字体各个内部笔划或偏旁部首元素计算出与该字多种已知风格字体的相似度,并以此确定该字体的风格一致性评分;

4)根据对汉字进行的单笔划美观度评分、内部结构美观度评分、风格一致性评分,应用统计学习方法综合各项得分,获得该字体的总体美观度评分。

所述的一种汉字美观度的计算机评估方法,其特征在于所述的通过多人调查的方式为500~2000个汉字单笔划的笔划样本评分,并使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体单笔划形态与其美观度评价结果间的映射关系,然后使用训练后的学习器对字体单笔划美观度进行评分方法包括如下步骤:

a)事先通过多人调查方式,让六人各自对来自100个汉字的单笔划图像做评分,评分结果为“好”、“一般”、“差”三种其中之一;综合所有人的评分结果,计算该笔划的分数概率,即:分别统计将笔划评分为“好”、“一般”、“差”的人数,将其除以总人数,所得三个百分数分别为该笔划美观度为“好”、“一般”、“差”的概率,获得500~2000个单笔划的美观度的人工评价结果;

b)将步骤a)中所述各笔划的楷书体图像作为该笔划的标准笔划;将这些单笔划图像参数化,即提取出它们的轮廓、轨迹、位置信号,转换成向量的形式,对这些向量进行预处理,去除噪音,并进一步抽取特征向量,对获得的特征向量,与该笔划的标准笔划的特征向量作向量减法,从而得到单笔划的形态差异向量;

c)使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得单笔划的形态差异向量中的信号差异与美观度评价结果间的函数映射关系;即以形态差异向量与美观度评价结果分别作为人工神经网络、决策树、模糊逻辑或支持向量机的输入和输出;应用步骤a)中的人工评价结果,对人工神经网络或决策树或模糊逻辑或支持向量机施行带有反馈的机器学习过程;

d)使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机对单笔划进行评分:即对任意给定的单笔划图像,应用步骤b)得到该笔划与其标准笔划间的形态差异向量,以该向量作为训练后的人工神经网络或决策树或模糊逻辑或支持向量机的输入,获取此时的输出,即为该汉字笔划的美观度得分。

所述的一种汉字美观度的计算机评估方法,其特征在于所述的通过多人调查的方式为500~2000个汉字样本的内部结构评分,并使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体内部结构特征与其美观度评价结果间的映射关系,然后使用训练后的学习器对字体内部结构进行评分,其中,字体内部结构包括字体各内部笔划或偏旁部首元素间的拓扑关系、相对位置关系、面积遮盖关系,以及笔划与笔划、笔划与偏旁部首之间的空间位置关系与该字的标准字体的差异,实现对字体内的各部分空间结构分布的美观度评分方法,包括以下步骤:

e)事先通过多人调查方式,事先通过多人调查方式,让六人分别对汉字图像做评分,评分结果为“好”、“一般”、“差”三种其中之一;综合所有人的评分结果,计算该字体的分数概率,即:分别统计将字体评分为“好”、“一般”、“差”的人数,分别将其除以总人数,所得百分数分别为该字体分数为“好”、“一般”、“差”的概率;通过这样的方式获得500~2000个字体空间结构美观度的人工评价结果;

f)通过笔划分解结果将该字体参数化,转换成向量的形式;这些向量层次化的表达了字体的轮廓、轨迹与相对位置信息;

g)将步骤e)中所述各字体的楷书体图像作为该字体的标准字体;提取出这些字体所对应向量中,各笔划或偏旁部首间的拓扑、几何关系的信号,与其标准字体的拓扑、几何关系的信号做比较,获得其信号差异,即做向量减法;

h)使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得向量信号差异与美观度评价结果间的映射关系;应用步骤e)中人工标定的评价结果,对人工神经网络、决策树、模糊逻辑或支持向量机施行带有反馈的迭代学习过程。

i)使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机对字体空间结构美观度进行评分。即对任意给定的字体图像,应用步骤f)-步骤g)得到该字体内部结构与该字的标准字体间的信号差异,以该差异向量作为训练后的人工神经网络或决策树或模糊逻辑或支持向量机的输入,获取此时的输出,即为该字体的内部结构美观度得分。

所述的一种汉字美观度的计算机评估方法,其特征在于所述的通过多人调查的方式为100~300个汉字样本的风格一致性评分,并使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体风格一致性特征与其美观度评价结果间的映射关系,使用训练后的学习器对字体风格一致性进行评分;对字体各个内部笔划或偏旁部首元素计算出与该字多种已知风格字体的相似度,并以此确定该字体的风格一致性评分的方法包括如下步骤:

j)事先通过多人调查方式,让多个人分别对多个汉字图像的风格一致性做评分,评分结果为“好”、“一般”、“差”三种其中之一;综合所有人的评分结果,计算该字体的分数概率,即:分别统计将该字评分为“好”、“一般”、“差”的人数,分别将其除以总人数,所得百分数分别为该该字分数为“好”、“一般”、“差”的概率;通过这样的方式获得100~300个汉字字体风格一致性的人工评价结果;

k)准备好这些汉字对应的楷书体、行书体及隶书体中的书写形态样本,或更多其他字体,作为已知字体;

l)通过笔划分解结果将以上字体参数化,转换成向量的形式;这些向量层次化的表达了字体的轮廓、轨迹与相对位置信息;

m)对各字体的每个部分,计算出该部分与其各种已知字体该部分的相似程度;单笔划Ai与已知字体Bj的相似度Sij的计算方法可以任选以下两种之一:

(1)以已知字体Bj作为单笔划Ai的标准笔划,使用单笔划美观度评分方法计算出该笔划美观度的三个概率值P1,P2,P3,分别表示该笔划美观度为“好”、“一般”、“差”的概率;在本实施例中,Sij=P1×50%+P2×50%;

(2)求出笔划Ai的范围矩形,即能包含该笔划所有部分的矩形中的最小矩形,并通过不断平移和绕范围矩形中心旋转Ai,使Ai的字迹与其字体Bj相应笔划的字迹的重合面积最大;设Ai的字迹面积为C1,其字体Bj相应笔划的字迹的面积为C2,则Sij=|C1∩C2|/|C1∪C2|,及相似程度为C1、C2交集面积与C1、C2并集面积的比值;

n)将字体每个部分与每种已知字体的相似程度聚合可得到一个矩阵,作为该字体的风格一致性特征;

o)使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得该矩阵与美观度评价结果间的映射关系;应用人工标定的评价结果,对人工神经网络、决策树、模糊逻辑或支持向量机施行带有反馈的迭代学习过程;

p)使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机对字体风格一致性进行评分。即对任意给定的字体图像,应用步骤k)-步骤n)得到该字体与各已知字体间的相似度,以该矩阵作为训练后的人工神经网络或决策树或模糊逻辑或支持向量机的输入,获取此时的输出,即为该字体的风格一致性得分。

所述的一种汉字美观度的计算机评估方法,其特征在于所述的根据对汉字进行的单笔划美观度评分、内部结构美观度评分、风格一致性评分,应用统计学习方法综合各项得分,获得该字体的总体美观度评分的方法包括如下步骤:

q)利用上述三个方法,使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机自动获得100~300个汉字的各单笔划美观度得分、内部结构美观度得分和字体风格一致性得分;

r)通过多人调查方式,让多个人分别对步骤q)中所述汉字图像做美观度总体评分,评分结果为“好”、“一般”、“差”三种其中之一;综合所有人的评分结果,计算该字体的分数概率,即:分别统计将字体评分为“好”、“一般”、“差”的人数,分别将其除以总人数,所得百分数分别为该字体分数为“好”、“一般”、“差”的概率;

s)使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得步骤q)中的得分与步骤r)中的美观度总体评分间的映射关系;应用人工标定的评价结果,对人工神经网络、决策树、模糊逻辑或支持向量机施行带有反馈的迭代学习过程;

t)使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机对字体的总体美观度进行评分,即对任意给定的汉字字体图像,应用步骤q)的方法得到该字体的单笔划美观度得分、内部结构美观度得分和字体风格一致性得分,并以这些得分作为训练后的人工神经网络或决策树或模糊逻辑或支持向量机的输入,获取此时的输出,即为该字体的总体美观度得分。

如图1所示,本发明所述的实施例系统的流程包括汉字图像101、笔划分解及汉字参数化102、汉字美观度评分方法103、汉字美观度评分结果104;其中汉字美观度评分方法103的组成包括汉字图像样例201、人类评分202、机器学习过程203;

本发明所述的实施例系统中的汉字美观度评分方法103包括学习和评分两部分:学习部分,即使用一个机器学习过程203,对汉字图像样例201与人类评分202之间的潜在关系进行探测,并得到训练后的学习器;评分部分,即使用经过机器学习过程203训练得到的学习器,对汉字图像101计算其美观度得分,得到汉字美观度评分结果104。

汉字图像101:汉字图像是指包含汉字字体的数字图像;在本实施例中,所有的字体图像都被分离成了一个个的单字,然后将它们归一化成同一尺寸的二值黑白图像(长宽均为300像素点);其示例如图3A所示。

笔划分解及汉字参数化102:在本实施例中,该部分包括以下步骤:

(A)从字体图像中提取其结构特征,其步骤详述如下(参见图3A、图3B、图3C):

1)对汉字图像101做细化(Thinning)处理,以获得该字的骨架图像;本实施例应用了ACM学报在1994年所公布的一个图像细化算法(“A noniterativethinning algorithm”ACM Transactions on Mathematical Software,20(1):5-20,1994);其示例如图3B所示;

2)从骨架图像中提取“特征点”(“特征点”的定义参考IEEE学报1999年公布的一篇文章“Identification of fork points on the skeletons of handwritten Chinesecharacters”IEEE Transactions on Pattern Analysis and Machine Intelligence(PAMI)21(10):1095-1100,1999,以下简称文献PAMI99),这些特征点将把整个骨架分割成若干条曲线段;

3)对每条曲线段都用多条首尾相连的直线段来近似,具体步骤如下:对每一条未被直线段取代的曲线段AB,设A、B分别是其两端端点;计算以曲线段AB上的某一点C为顶点的夹角ACB,当角ACB最大时的角度值小于一个预定值(如135度),则将曲线段AB分割成AC,CB两段;否则以直线段连接AB两点,取代原有的曲线段AB;该步骤不断进行直至所有曲线段均被直线段所取代;

4)由一系列直线段及其端点构成的图被称为该字体的“几何图”(geometricgraph);对“几何图”做修正和剪枝;本实施例应用了文献PAMI99中使用的骨架图修正技术;最终得到的“几何图”示例如图3C所示;

(B)在步骤(A)中所述汉字字体与其标准字体间计算出一个最佳的笔划匹配,从而完成笔划分解,其步骤详述如下(参见图4):

1)对步骤(A)所述字体的标准字体重复步骤(A),得到该标准字体的“几何图”;并假设标准字体的笔划分解结果已经预知;

2)在步骤(A)中所述字体的“几何图”与其标准字体的“几何图”间,计算出一个最佳的笔划匹配结果;本实施例应用了《模式识别》杂志于2001年公布的一篇文章(“Model-based stroke extraction and matching for handwritten Chinesecharacter recognition”.Pattern Recognition,34(12):2339-2352,2001)中所述启发式搜索的方法来计算出“几何图”上的笔划间一一对应关系;

3)将“几何图”上以多条直线段表示的各笔划轨迹,转化为在原字体轮廓上的笔划分解结果,其具体方法为:对各笔划上的各直线段上的每一点,以其为圆心画椭圆,使该椭圆尽量大而又不包含任何原字体图像上的空白部分(即在原字体的黑白图像上,该椭圆区域内的所有像素点均为黑色),该笔划的所有椭圆区域总和即为笔划分解所得的图像轮廓;

(C)对与标准字体形态相差较大的字体,对步骤(B)中无法完成匹配的部分笔划,使用一个交互式的用户界面来协助笔划分解,其步骤详述如下(参见图5):

1)用户通过交互式的用户界面来为字体描绘其骨架草图;

2)根据用户草图来修改由标准字体而得的“几何图”;本实施例将步骤(2)中未完成匹配的部分笔划在标准字体“几何图”中均由用户草图的对应部分所替代;

3)重复步骤(B),重新计算笔划间的最佳匹配方案,从而完成笔划分解;

(D)对完成笔划分解的字体,将其参数化,以向量的形式表达;本实施例采用了文献IS2005中的汉字参数化方法,每个字体都等价的用一个矩阵在向量空间中表示。

汉字美观度评分方法103:如前所述,包括汉字图像样例201、人类评分202、机器学习过程203;最终用训练得到的学习器来对笔划分解及汉字参数化102得到的结果做评分,而得到汉字美观度评分结果104。

汉字图像样例201:同汉字图像101,但使用于人类评分后供机器学习过程203来学习;

人类评分202:通过调查的方式让一定数量的人分别对字体图像做评分(单笔划美观度或字体内部结构美观度或字体风格一致性),评分结果为“好”、“一般”、“差”三种其中之一;综合所有人的评分结果,计算该字体的分数概率,即:分别统计将字体评分为“好”、“一般”、“差”的人数,分别将其除以总人数,所得百分数分别为该字体分数为“好”、“一般”、“差”的概率;

机器学习过程203:使用一个学习器(如人工神经网络),其输入为该字体的特征参数,其输出为3个百分数,分别表示该字体分数为“好”、“一般”、“差”的概率;利用汉字图像样例201及其对应的人类评分,对学习器做训练;使用训练后的学习器对字体美观度做出评分。

如图2所示,汉字美观度评分分为四种:单笔划美观度评分301、内部结构美观度评分302、内部风格一致性评分303、总体美观度评分304。

(E)单笔划美观度评分301,包括以下步骤:

1)事先准备一定数量的汉字图像样例201(均为单笔划图像),并对其做人类评分202,获得一定数量的单笔划的美观度人类评分结果;

2)对每个单笔划,使用笔划分解及汉字参数化102中的细化算法得到其骨架,并使用文献IS2005中的参数化方法得到其参数化表示;取骨架上的一条最大路径;所谓最大路径是指一条包含于骨架的离散曲线,并且以该曲线上的点为圆心的覆盖椭圆的面积之和在所有包含于骨架的离散曲线中为最大(覆盖椭圆Covering Ellipse的定义参见文献IS2005);

3)对最大路径上的每个点,做其法向直线,使直线两端刚好位于该笔划字迹边沿并过该点,此即该点处的笔划宽度;

4)将该笔划的最大路径分成三段;分段方法包含以下步骤:【1】枚举分成三段所需的两个分割点的位置;【2】对每种分段方法,计算每段上所有点的笔划宽度的平均值,记其为w1、w2、w3;【3】若max{|w1-w2|,|w2-w3|}超过一个阈值,则转步骤10),否则转步骤5);在本实施例中,该阈值取值为最大路径两端端点间直线距离的1/4;

5)如图6所示,对最大路径上的每个点,提取出它的坐标S=(Sx,Sy),它所对应覆盖椭圆的长轴半径与短轴半径分别组成的两条一维曲线Ma、Mi,以及骨架该点到字体外轮廓边缘的最近距离组成的一维曲线D;所有点的这些特征组成了5条一维曲线;

6)记ω=(Sx,Sy,Ma,Mi,D),求出该笔划的标准字的对应信号ω0=(Sx0,Sy0,Ma0,Mi0,D0),并获得ω与ω0之间的差异,设ω*=ω-ω0;

7)对ω*中每条曲线计算其一阶导数,得到另一曲线集合ω’=(Sx’,Sy’,Ma’,Mi’,D’);

8)对ω*中的每一条一维曲线C,求出曲线C上的最大值Cmax,平均值Cave,中位值Cmed;对ω’中的每一条一维曲线C’,求出曲线C’上的最大值Cmax’,平均值Cave’,中位值Cmed’;

9)将Cmax’/Cmax、Cave’/Cmax、Cmed’/Cmax、Cmax’/Cave、Cave’/Cave、Cmed’/Cave、Cmax’/Cmed、Cave’/Cmed、Cmed’/Cmed作为学习器输入,三个取值在0到100间的实数作为学习器的输出(分别对应该笔划美观度为“好”、“一般”、“差”的概率),使用该学习器对步骤1)中所用的汉字图像样例201并结合其人工评分结果202作为学习样本,对F与单笔划评分结果间的关系进行学习;本实施例使用了反向传播神经网络(Back-Propagating Neural Network)作为学习器;转步骤11);

10)对该笔划三段中的每一段,视为一个单独笔划并对其执行步骤5)-8);将这三段中每一段的Cmax’/Cmax、Cave’/Cmax、Cmed’/Cmax、Cmax’/Cave、Cave’/Cave、Cmed’/Cave、Cmax’/Cmed、Cave’/Cmed、Cmed’/Cmed作为学习器输入,三个取值在0到100间的实数作为学习器的输出(分别对应该笔划美观度为“好”、“一般”、“差”的概率),使用该学习器对步骤1)中所用的汉字图像样例201并结合其人工评分结果202作为学习样本,对F与单笔划评分结果间的关系进行学习;本实施例使用了反向传播神经网络(Back-Propagating NeuralNetwork)作为学习器;

11)使用学习后的学习器,对汉字单笔划进行评分;

(F)内部结构美观度评分302,包括以下步骤:

1)事先准备一定数量的汉字图像样例201,并对其内部结构美观度做人类评分202,获得一定数量的内部结构美观度的人类评分结果;

2)提取出这些字体所对应向量中,各部分(如笔划、部首)间拓扑、几何等关系的信号;本实施例使用的信号包括:对每一对笔划x和y,我们计算出x和y所有点在平面上的相互最大距离Lmax、最小距离Lmin和平均距离Lave;这些值可以描述出这些笔划间的空间关系与拓扑关系。另外,我们在每个笔划上画出它的范围矩形(bounding box,即能包含该笔划所有部分的矩形中的最小矩形);然后对每两个范围矩形计算它们在水平方向、竖直方向以及面积上的重叠部分,分别记为Bh(x,y)、Bv(x,y)、Bp(x,y);

3)假设该字体的笔划共有n个,通过步骤2)可以得到6个n×n矩阵,记为Mmax、Mmin、Mave、Mh、Mv、Mp,其中每个矩阵的第i行第j列元素代表了该字体第i笔划与第j笔划间的相应关系;

4)将步骤3)所述6个矩阵与该字的标准字体所对应的6个矩阵相减,记其运算结果为Qmax、Qmin、Qave、Qh、Qv、Qp;连同其逆矩阵一起共12个矩阵,记为Qi(i=1,...,12);

5)对每个Qi,求得其矩阵元素中的最大值最小值最大绝对值平均值中位值连同该Qi的前三个矩阵特征值λ1、λ2、λ3一起,作为学习器的输入;

6)三个取值在0到100间的实数作为学习器的输出(分别对应该结构美观度为“好”、“一般”、“差”的概率),使用该学习器对步骤1)中所用的汉字图像样例201并结合其人工评分结果202作为学习样本,对内部结构特征与其美观度评分结果间的关系进行学习;本实施例使用了反向传播神经网络(Back-PropagatingNeural Network)作为学习器;

7)使用学习后的学习器,对内部结构美观度进行评分;

(G)内部风格一致性评分303,包括以下步骤:

1)事先准备一定数量的汉字图像样例201,并对其内部风格一致性做人类评分202,获得一定数量的内部风格一致性的人类评分结果;

2)准备好字体样例所对应的若干种已知字体,如楷书体、行书体、隶书体等,每个字体样例均有m种已知字体,记为{Bj|j=1,2,...,m};对该字体图像内的每个子部分Ai(如对每个单笔划,i=1,2,...,n),计算出它与每种已知字体中对应子部分的相似程度Sij(i=1,2,...,n;j=1,2,...,m),计算结果以一个百分数表示;每个字体图像可得到一个n×m的矩阵F={Sij};

3)将矩阵F作为学习器的输入,三个取值在0到100间的实数作为学习器的输出(分别对应该字体风格一致性为“好”、“一般”、“差”的概率),使用该学习器对步骤1)中所用的汉字图像样例201并结合其人工评分结果202作为学习样本,对F与字体内部风格一致性评分结果间的关系进行学习;本实施例使用了反向传播神经网络(Back-Propagating Neural Network)作为学习器;

4)使用学习后的学习器,对内部风格一致性进行评分;

(H)总体美观度评分304,包含以下步骤:

1)利用上述三个方法301、302、303,使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机自动获得100~300个字体的各单笔划美观度得分、内部结构美观度得分和书写风格一致性得分;

2)通过多人调查方式,让一定数量的人分别对以上字体图像做美观度总体评分,评分结果为“好”、“一般”、“差”三种其中之一;综合所有人的评分结果,计算该字体的分数概率,即:分别统计将字体评分为“好”、“一般”、“差”的人数,分别将其除以总人数,所得百分数分别为该字体分数为“好”、“一般”、“差”的概率;

3)使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得步骤1)中的得分与步骤2)中的美观度总体评分间的映射关系;应用人工标定的评价结果,对人工神经网络、决策树、模糊逻辑或支持向量机施行带有反馈的迭代学习过程;

4)使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机对字体的总体美观度进行评分。即对任意给定的汉字图像,应用步骤(1)的方法得到该字体的单笔划美观度得分、内部结构美观度得分和书写风格一致性得分,并以这些得分作为训练后的人工神经网络或决策树或模糊逻辑或支持向量机的输入,获取此时的输出,即为该字体的总体美观度得分。

汉字美观度评分结果104:同人类评分202的结果,以三个百分数来分别表示该字体美观度为“好”、“一般”、“差”的概率。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号