首页> 中文学位 >手写体汉字的合成方法研究
【6h】

手写体汉字的合成方法研究

代理获取

摘要

手写体汉字识别和生成一直是模式识别领域的一大难题,对手写体汉字识别的研究有助于提出解决模式识别一些基本问题的方法,手写体汉字生成的研究则有助于手写体识别的研究。用生成的手写体字符可以为机器学习、模式识别提供大量的训练样本,还可以用合成的字符生成个性化文档。 现有的关于字符生成的算法大部分都是关于英文字符,但这些算法都不适合汉字的生成。本文通过两个方面对汉字合成进行分析,一是用英文字符的方法即形状统计的方法进行汉字合成,具体包括了三个方面:汉字形状的变化表示、汉字笔划的形状表示和笔划、部首的空间结构统计。 另一方面是基于汉字层次模型的合成方法,通过汉字的三层等级表示将汉字分解为基本的部件。这些基本部件形成笔划和部首数据集合。在合成过程,我们运用基于小波变换的特征提取方法选取合适的笔划和部首作为候选。并且我们从汉字的结构特征出发提出了一些汉字的“美学约束”。在组合过程中我们运用遗传算法来搜索符合“美学约束”的最优结果。具体内容包括四个方面:汉字的三层等级表示模型、汉字的“美学约束”定义、基于小波分解的特征提取、基于遗传算法的最优搜索。具体为: (1) 汉字的三层等级表示模型 大部分得汉字是由一些基本的笔划和部首组成,本文将汉字分解成“ ”三层模型。 (2) 汉字的部件之间的关系 从汉字的结构性质出发,我们定义了一些符合汉字特性的“美学约束”,并将这些“约束”量法。并在搜索过程中搜索符合这些“约束”的汉字。 (3) 基于小波分解的特征提取 本文引入小波变换,并利用小波变换的多尺度特性抽取汉字更为有用的“轮廓”信息。以此来选择候选的基本笔划和基本部首。 (4) 基于遗传算法的最优组合 由候选笔划和部首组合得到的字符数量庞大,为了得到其中最符合“美学约束”的汉字,一个蛮干的方法就是穷举所有的汉字,但是效率太低。我们利用遗传算法来进行近似的最优搜索。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号