首页> 中国专利> 汉字书写笔画间关系规范性描述与评判方法及装置

汉字书写笔画间关系规范性描述与评判方法及装置

摘要

本发明涉及汉字书写笔画间关系规范性描述与评判方法及装置,该方法包括:获取手写汉字的笔画;确定手写汉字笔画的笔段,判断笔画是否有拐点,如果是,将笔画在拐点处断开,分成多个笔段,否则,把一个笔画作为一个笔段;判定手写汉字每一笔画的笔段与其它笔画的笔段的邻近位置关系;判定任意两笔画笔段间的邻近位置关系具体为:将笔段位置划分为三段,分为头部T、中部Z和尾部W,以两个笔段中最邻近的点在两个笔段上的位置来判断其关系;获取手写汉字对应的标准汉字每一笔画的笔段与其它笔画的笔段的邻近位置关系;判定手写汉字的规范性。本发明将每个手写汉字笔段分为三部分进行判断,方法简单,降低了计算难度,提高了运算效率。

著录项

  • 公开/公告号CN104408397A

    专利类型发明专利

  • 公开/公告日2015-03-11

    原文格式PDF

  • 申请/专利权人 祁亨年;

    申请/专利号CN201410500411.7

  • 发明设计人 祁亨年;

    申请日2014-09-25

  • 分类号

  • 代理机构宁波江东全方专利商标事务所(普通合伙);

  • 代理人肖华

  • 地址 311300 浙江省杭州市临安环城北路林水山居

  • 入库时间 2023-12-17 04:36:06

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-05-01

    授权

    授权

  • 2015-04-08

    实质审查的生效 IPC(主分类):G06K9/00 申请日:20140925

    实质审查的生效

  • 2015-03-11

    公开

    公开

说明书

技术领域

本发明涉及手写汉字规范性判定技术领域,尤其涉及对书写汉字的过程与 结果进行动态评价的评判方法与装置。

背景技术

根据汉字的书写过程和构成结构,汉字书写的评测可分为四个阶段:笔画 规范性评测、笔顺规范性评测、笔画间关系规范性评判和结构规范性评测。汉 字书写过程规范与否,尤其是书写错误的情况,一般要给出确定的判断。手写 汉字规范性判定技术领域,比较重要的一环是笔画间关系的评判技术。结构规 范性的一部分是笔画间关系的评判,即笔画与笔画之间的关系,这不仅仅限于 笔画间是交叉、相接或相离(简称交接离)的关系,还要考虑判断这种交接离 关系所涉及的两个笔画的位置,另外还要考虑评判的效率,降低计算难度。

现有技术只是限于评判汉字笔画间的交叉、相接还是相离的关系,并没有 考虑到手写汉字笔段之间距离与位置的关系。本发明在专利公开号为 CN101320422A的专利名称为《手写汉字笔画交接离的规范性判定方法和装置》 的专利技术基础上,提出了一种更为简洁的笔画间关系的描述方法,定义了邻 近位置的概念和描述方法,能简洁描述和评判汉字笔段或笔画间关系的规范性, 包括交接离及涉及的笔画位置关系。

发明内容

为克服上述问题,本发明提出了一种汉字书写笔画间关系规范性描述与评 判方法及装置。

本发明中两个笔画笔段间的邻近位置是指:两个笔段中最邻近的点在两个 笔段上的位置。

本发明的技术方案为:

汉字书写笔画间关系规范性描述与评判方法,其特征在于,包括:

1)获取手写汉字的笔画;

2)确定手写汉字笔画的笔段,判断笔画是否有拐点,如果是,将笔画在拐 点处断开,分成多个笔段,否则,把一个笔画作为一个笔段;

3)判定手写汉字每一笔画的笔段与其它笔画的笔段间的邻近位置关系;

判定任意两笔画笔段间的邻近位置关系具体为:将笔段位置划分为三段, 分为头部T、中部Z和尾部W,以两个笔段中最邻近的点在两个笔段上的位置 来判断其关系;

4)获取手写汉字对应的标准汉字每一笔画的笔段与其它笔画的笔段间的邻 近位置关系;

5)判定手写汉字的规范性:比较手写汉字笔段间的邻近位置关系与标准汉 字笔段间的邻近位置关系,如果相同,则手写汉字笔画间关系符合书写规范;如 果不相同,则手写汉字笔画间关系不规范。

进一步,在步骤2)之后还包括如下步骤:

a)获取书写错误评判规则库中与该手写汉字对应的汉字的书写错误评判规 则,评判规则采用邻近位置关系规则;

b)获取与书写错误评判规则库中对应的手写汉字笔段间的邻近位置关系;

c)判断书写错误评判规则库中规定的笔段间的规则是否与手写汉字对应的 笔段间的邻近位置关系相符合,如果符合,则手写汉字笔画间关系不规范,如 果不符合,则执行步骤3)。

进一步,书写错误评判规则库中与该汉字的邻近位置关系规则为:设置三 元组f(x,y,NonState)来表示书写错误评判规则库中该汉字的笔段间的错误邻 近位置关系;

其中x表示当前笔画的序列号,即该手写汉字的第几笔,y表示其它将与之 作比较的笔画的序列号,x,y可以是整数,也可以是小数,其中x,y整数部分代表 第几笔画,小数部分代表该笔画中的第几笔段;NonState表示在第x笔段上与 第y笔段相邻近的点位于第x笔段上的错误位置信息,NonState指定的错误位 置信息分为头部T、中部Z和尾部W。

进一步,假设笔段上设置有m,n两点,m,n两点将一个笔段划分为头部 T、中部Z和尾部W三个区域,头部T区域范围从笔段的起点至点m,中部Z 区域范围从点m至点n,尾部W区域范围从点n至笔段的结束点;假设笔段长 度为1个单位,根据经验值,则点m的取值范围为1/7~1/3;点n的取值范围为 2/3~6/7。

进一步,根据不同字体设置不同头部、中部、尾部区域范围。

汉字书写笔画间关系规范性描述与评判装置,其特征在于,包括:

1)手写汉字笔画获取单元,用于获取手写汉字的笔画;

2)笔段确定单元,用于判断笔画是否有拐点,如果笔画存在拐点,将笔画 在拐点处断开,分成多个笔段,否则,把一个笔画作为一个笔段;

3)手写汉字笔段间邻近位置判定单元,用于判定手写汉字每一笔画的笔段 与其它笔画的笔段的位置关系;

判定任意两笔段的邻近位置关系具体为:将笔段位置划分为三段,分为头 部T、中部Z和尾部W,以两个笔段中最邻近的点在两个笔段上的位置来判断 其关系;

4)标准汉字库:存储有汉字中每一笔画的笔段与其它笔画的笔段的邻近位 置关系;

5)标准汉字笔段间邻近位置判定单元,用于获取手写汉字对应的标准汉字 库中存储汉字的每一笔画的笔段与其它笔画的笔段的位置关系;

6)第二规范性确定单元,比较手写汉字笔段间的位置关系与标准汉字笔段 间的位置关系,如果相同,则手写汉字笔画间关系符合书写规范;如果不相同, 则手写汉字笔画间关系不规范。

进一步,汉字书写笔画间关系规范性描述与评判装置还包括:

a)书写错误评判规则库,规则库中已预先存储有常见的汉字书写错误的评 判规则;

b)错误类型获取单元,获取书写错误评判规则库中评判规则;

c)第一规范性确定单元,用于判断书写错误评判规则库中规定的笔段间的规则 是否与手写汉字对应的笔段间的邻近位置关系相符合,如果符合,则手写汉字 笔段间关系不规范,如果不符合,则送至手写汉字笔段间邻近位置判定单元, 用于判定手写汉字每一笔画的笔段与其它笔画的笔段的位置关系。

进一步,书写错误评判规则库中的常见错误的评判规则为:设置三元组f(x, y,NonState)来表示书写错误评判规则库中该汉字的笔段间的错误邻近位置关 系;

其中x表示当前笔画的序列号,即该手写汉字的第几笔,y表示其它将与之作比 较的笔画的序列号,x,y可以是整数,也可以是小数,其中x,y整数部分代表第几 笔画,小数部分代表该笔画中的第几笔段;NonState表示在第x笔段上与第y 笔段相邻近的点位于第x笔段上的错误位置信息,NonState指定的错误位置信 息分为头部T、中部Z和尾部W。

进一步,假设笔段上设置有m,n两点,m,n两点将一个笔段划分为头部 T、中部Z和尾部W三个区域,头部T区域范围从笔段的起点至点m,中部Z 区域范围从点m至点n,尾部W区域范围从点n至笔段的结束点;假设笔段长 度为1个单位,根据经验值,则点m的取值范围为1/7~1/3;点n的取值范围为 2/3~6/7。

进一步,根据不同字体设置不同头部、中部、尾部区域范围。

本发明的优点在于:

1.本发明可以快速评判书写汉字的正确性。本发明充分考虑手写汉字笔段 之间的关系,在专利公开号为CN101320422A、CN101344918A公开的笔画间关 系的技术基础上,提出了一种更为简洁的笔画间关系的描述方法,定义了邻近 位置的概念和描述方法,能简洁描述和评判汉字笔段或笔画间关系的规范性, 包括交接离及涉及的笔画位置关系。本发明可以将手写汉字笔段距离和位置关 系与笔画间关系相结合,生成笔段间的距离位置关系,提高智能评判汉字的准 确性。例如“人”和“入”之间的评判,在现有的书写汉字笔画评判技术中, 这两个字的评判准确率低。当引入笔画间邻近位置关系时,将“人”和“入” 的撇和捺按照手写汉字的起点分别分为头部(T)、中部(Z)、尾部(W),则确 定其邻近位置的关系描述分别为ZT、TZ,提高了评判准确率。

2.本发明将每个手写汉字笔段分为三部分进行判断,方法简单,降低了评判 计算难度,提高了运算效率。

3.在比较手写汉字笔段间的邻近位置关系与标准汉字笔段间的邻近位置关 系前,设置了书写错误评判规则库及预先判定常见书写错误类型,大大提高了 运算的效率。

附图说明

图1是汉字书写笔画间关系规范性描述与评判方法示意图;

图2是汉字书写笔画间关系规范性描述与评判装置的结构示意图;

图3是汉字“与”字书写笔画及笔段示意图。

具体实施方式

为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解, 下面结合图示与具体实施例,进一步阐述本发明。

实施例一:

如图1所示,汉字书写笔画间关系规范性描述与评判方法,包括:

步骤101.获取手写汉字的笔画;

上述获取手写汉字笔画的方法可以为使用者在触摸屏上写字,触摸屏将触 摸压力转换为象素点,把该象素点作为手写汉字笔画;也可以在白纸上写字, 扫描该白纸上的汉字,转化为象素点,把该象素点作为手写汉字笔画。

步骤102.确定手写汉字笔画的笔段;

判断笔画是否有拐点,如果是,将笔画在拐点处断开,分成多个笔段,否 则,把一个笔画作为一个笔段;关于具体如何判断是否有拐点的方法,专利公 开号为CN101320422A的发明专利对此有详细介绍。

步骤103.获取书写错误评判规则库中与该手写汉字对应的汉字的书写错 误评判规则;

书写错误评判规则库中已预先存储有常见的汉字书写错误类型的评判规 则;例如汉字“身”、“射”的常见错误发生在其第7笔与第6笔位置上,为此针 对这两个汉字,可直接在书写错误评判规则库中规定其第7笔与第6笔的评判 规则。本实施例中汉字书写错误的评判规则采用邻近位置进行判断是否书写错 误。

在书写错误评判规则库中,判定任意两笔段的邻近位置关系具体为:将笔 段位置划分为三段,分为头部(T)、中部(Z)和尾部(W),以两个笔段中最邻近 的点在两个笔段上的位置来判断其关系;假设笔段A和笔段B为某汉字中的任 一两笔段,笔段A上的点a和笔段B上的点b为最邻近的两点,在笔段A上和 笔段B最为邻近的点a位于笔段A的头部,则其位置关系描述为头部(T),在 笔段B上和笔段A最为邻近的点b位于笔段B的中部,则其位置关系描述为中 部(Z)。

假设笔段上设置有m,n两点,m,n两点将一个笔段划分为头部T、中部Z 和尾部W三个区域,头部T区域范围从笔段的起点至点m,中部Z区域范围从 点m至点n,尾部W区域范围从点n至笔段的结束点。假设笔段长度为1个单 位,根据经验值,则点m的取值范围为1/7~1/3;点n的取值范围为2/3~6/7。 根据不同字体可灵活设置不同的m,n参数值,以调整头部、中部、尾部区域范 围。

本实施例通过提供三元组f(x,y,NonState)来表示书写错误评判规则库中该 汉字的笔画的笔段与其它笔画的笔段之间邻近位置存在错误时的评判规则;其 中x表示当前笔画的序列号,即该手写汉字的第几笔,y表示其它将与之作比较 的笔画的序列号,State表示在第x笔段上与第y笔段邻近的点位于第x笔段上 的邻近位置信息;NonState表示在第x笔段上与第y笔段邻近的点位于第x笔 段上的错误邻近位置信息,NonState指定的错误位置信息分为头部(T)、中部(Z) 和尾部(W)三个;x,y可以是整数,也可以是小数,其中x,y整数部分代表第几笔 画,小数部分代表该笔画中的第几笔段。

以汉字“身”字为例,其第7笔段上与第6笔段最为邻近点位于第7笔段位置 为中部(Z),当第7笔与第6笔最为邻近的点位于第7笔的头部时,即存在错 误邻近位置关系,在书写错误评判规则库中可表示为:f(7,6,T)。

以汉字“射”字为例,在第7笔段上与第6笔段最为邻近点位于第7笔段位置 为头部T;其第7笔与第6笔最为邻近的点位于第7笔的中部时,即存在错误邻 近位置关系,在书写错误评判规则库中可表示为:f(7,6,Z)。

步骤104.获取与书写错误评判规则库中对应的手写汉字笔段间的邻近位 置关系;

本实施例通过提供三元组(x,y,State1)来表示每个笔画与其它笔画之间的 邻近位置关系;其中x表示当前笔画的序列号,即该手写汉字的第几笔,y表示 其它将与之作比较的笔画的序列号,State1表示在第x笔段上与第y笔段邻近的 点位于第x笔段上的位置,State1状态分为头部(T)、中部(Z)和尾部(W)三个状 态。x,y可以是整数,也可以是小数,其中x,y整数部分代表第几笔画,小数部分 代表该笔画中的第几笔段。

步骤105.判断书写错误评判规则库中规定的笔段间的规则是否与手写汉字 对应的笔段间的邻近位置关系相符合,如果符合,则手写汉字笔画间关系不规 范,如果不符合,则执行步骤106;

如果步骤103通过三元组f(x,y,NonState)来表示书写错误评判规则库中 该汉字的笔段与其它笔画的笔段之间的错误邻近位置关系,那么相对应的,步 骤103获取的每个笔画的笔段与其他笔画的笔段之间的关系也通过三元组(x,y, State1)来表示。比较这两个三元组,如果符合,则手写汉字笔画间关系不规范, 如果不符合,则执行步骤106;

步骤106.判定手写汉字每一笔画的笔段与其它笔画的笔段的邻近位置关 系;

在此处,判定任意两笔段的邻近位置关系具体为:将笔段位置划分为三段, 分为头部(T)、中部(Z)和尾部(W),以两个笔段中最邻近的点在两个笔段上的 位置来判断其关系;假设笔段A和笔段B为某汉字中的任一两笔段,笔段A上 的点a和笔段B上的点b为最邻近的两点,在笔段A上和笔段B最为邻近的点 a位于笔段A的头部,在笔段B上和笔段A最邻近的点b位于笔段B的中部, 则笔段AB的距离位置关系描述为TZ;

本实施例通过提供三元组(x,y,State2)来表示每个笔画与其它笔画之间的 邻近位置关系;其中x表示当前笔画的序列号,即该手写汉字的第几笔,y表示 其它将与之作比较的笔画的序列号,State2表示第x笔与第y笔之间的邻近位置 关系,为一两位数字;x,y可以是整数,也可以是小数,其中x,y整数部分代表第 几笔画,小数部分代表该笔画中的第几笔段。

如图3所示,显示汉字“与”书写笔画及笔段,其中数字“2.1”表示第2 笔画中的第一个笔段,其整数部分“2”代表第2笔画,小数部分“1”代表第2 笔画竖折折钩的第一个笔段竖部分;三元组(1,2.1,TZ)表示:在第1笔段 上和第2.1笔段最为邻近的点位于第1笔段的头部,在第2.1笔段上和第1笔段 最为邻近的点位于第2.1笔段中部,第1笔段和第2.1笔段的邻近位置关系为TZ。

以汉字“人”为例,“人”的两个笔画就是两个笔段,在第1笔段上和第2 笔段最为邻近的点位于第1笔段的中部,在第2笔段上和第1笔段最为邻近的 点位于第2笔段头部,那么第1笔段和第2笔段的邻近位置关系为ZT,为此其 对应的三元组为(1,2,ZT)。

以汉字“入”为例,“入”的两个笔画就是两个笔段,在第1笔段上和第2 笔段最为邻近的点位于第1笔段的头部,在第2笔段上和第1笔段最为邻近的 点位于第2笔段中部,那么第1笔段和第2笔段的邻近位置关系为TZ,为此其 对应的三元组为(1,2,TZ)。

步骤107.获取手写汉字对应的标准汉字每一笔画的笔段与其它笔画的笔段 的邻近位置关系;

标准汉字每一笔画的笔段与其它笔画的笔段的邻近位置关系可以预先判定 并存储,即将全部标准汉字的每一笔画的笔段与其它笔画的笔段的邻近位置关 系保存起来;在判定规范性之前,直接读取手写汉字对应的标准汉字的笔段位 置关系。也可以先读取手写汉字对应的标准汉字,然后根据步骤102和步骤106 的原理,判定标准汉字每一笔画的笔段与其他笔画的笔段的邻近位置关系。

步骤108.判定手写汉字笔段间的规范性。

比较手写汉字笔段间的关系与标准汉字笔段间的邻近位置关系,如果相同, 则手写汉字笔段间关系书写规范;如果不相同,则手写汉字笔段间关系不规范。

如果步骤106通过三元组(x,y,State2)来表示每个笔画与其它笔画之间的 关系,相对应的,步骤107获取的每个笔画与其他笔画之间的关系也通过三元 组(x,y,State2)来表示。比较这两个三元组(x,y,State2),从而判定手写汉字 笔段间的规范性。

本发明可用于在通过手写输入装置在线书写的情况下,实现汉字书写规范 性的自动和实时评价,从而可实现汉字书写规范性考核结果的量化与考核方式 及其信息的网络化,还可实现汉字规范书写的计算机实时指导。

通过比较手写汉字笔段间的位置关系与标准汉字笔段间的位置关系,判定手 写汉字的书写各笔画间的位置关系是否规范,克服了人工批阅主观性的缺点,可 实现汉字书写规范性的实时评价,具有评价客观全面的优点。

实施例二

请参考图2,为本发明实施例的汉字书写笔画间关系规范性描述与评判装置 示意图。本实施例的汉字书写笔画间关系规范性描述与评判装置200,包括:

(1)手写汉字笔画获取单元201,用于获取手写汉字的笔画;

(2)笔段确定单元202,用于判断笔画是否有拐点,确定手写汉字笔画的 笔段;如果笔画存在拐点,将笔画在拐点处断开,分成多个笔段,否则,把一 个笔画作为一个笔段;

(3)书写错误评判规则库203,规则库中已预先存储有常见的汉字书写错 误的评判规则;标准汉字库204,存储有汉字中每一笔画的笔段与其它笔画的笔 段的邻近位置关系;

在书写错误评判规则库中,判定任意两笔段的邻近位置关系具体为:将笔 段位置划分为三段,分为头部(T)、中部(Z)和尾部(W),以两个笔段中最邻近 的点在两个笔段上的位置来判断其关系;假设笔段A和笔段B为某汉字中的任 一两笔段,笔段A上的点a和笔段B上的点b为最邻近的两点,在笔段A上和 笔段B最为邻近的点a位于笔段A的头部,则其位置关系描述为头部(T),在 笔段B上和笔段A最为邻近的点b位于笔段B的中部,则其位置关系描述为中 部(Z)。

假设笔段上设置有m,n两点,m,n两点将一个笔段划分为头部T、中部Z 和尾部W三个区域,头部T区域范围从笔段的起点至点m,中部Z区域范围从 点m至点n,尾部W区域范围从点n至笔段的结束点。假设笔段长度为1个单 位,根据经验值,则点m的取值范围为1/7~1/3;点n的取值范围为2/3~6/7。 根据不同字体可灵活设置不同的m,n参数值,以调整头部、中部、尾部区域范 围。

本实施例通过提供三元组f(x,y,NonState)来表示书写错误评判规则库中该 汉字的笔画的笔段与其它笔画的笔段之间邻近位置存在错误时的评判规则;其 中x表示当前笔画的序列号,即该手写汉字的第几笔,y表示其它将与之作比较 的笔画的序列号,State表示在第x笔段上与第y笔段邻近的点位于第x笔段上 的邻近位置信息;NonState表示在第x笔段上与第y笔段邻近的点位于第x笔 段上的错误邻近位置信息,NonState指定的错误位置信息分为头部(T)、中部(Z) 和尾部(W)三个;x,y可以是整数,也可以是小数,其中x,y整数部分代表第几笔 画,小数部分代表该笔画中的第几笔段。

(4)错误类型获取单元205,用于获取书写错误评判规则库203中与手写 汉字对应的汉字的书写错误评判规则;

(5)手写汉字笔段间邻近位置判定单元206,用于判定手写汉字每一笔画 的笔段与其它笔画的笔段的位置关系;

判定任意两笔段的距离位置关系具体为:将笔段上的位置区分为头部(T)、 中部(Z)和尾部(W),以两个笔段最邻近的两点在其笔段上的位置来表示两笔段的 距离位置关系;假设笔段A上和笔段B为某汉字中的任一两笔段,在笔段A上 和笔段B最邻近的点位于笔段A的头部,在笔段B上和笔段A最邻近的点位于 笔段B的中部,则笔段AB的距离位置关系描述为TZ;

(6)第一规范性确定单元207、第二规范性确定单元208。

第一规范性确定单元207用于判断书写错误评判规则库中规定的笔段间书 写错误评判规则是否与手写汉字对应的笔段间的邻近位置关系相符合,如果符 合,则手写汉字笔段间关系不规范,如果不符合,则送至手写汉字笔段间邻近 位置判定单元206,用于判定手写汉字每一笔画的笔段与其它笔画的笔段的位置 关系;

第二规范性确定单元208用于比较手写汉字笔段间的位置关系与标准汉字 笔段间的位置关系,如果相同,手写汉字笔段间位置关系规范,否则,手写汉字 笔段间位置关系不规范。

(7)标准汉字笔段间邻近位置判定单元209,用于获取手写汉字对应的标 准汉字库中存储汉字的每一笔画的笔段与其它笔画的笔段的位置关系;

以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业 的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中 描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下本发明还 会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号