首页> 中文学位 >脱机手写满文文字识别研究
【6h】

脱机手写满文文字识别研究

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1课题的研究背景和研究意义

1.2满文文字特点

1.3文字识别研究现状

1.3.1文字识别概况

1.3.2蒙古文文字识别研究

1.4本文所要研究的内容

1.5本文的内容安排

第二章满文编码系统

2.1满文编码现状

2.2满文音码编码方案

2.3满文形码编码方案

2.4本章小结

第三章满文输入法和信息形式转换

3.1满文输入法

3.1.1满文搭配字母的提出

3.1.2标准罗马转写满文输入法的构建

3.1.3输入法的实现

3.2信息形式转换

3.2.1圈点满文向罗马转写转换算法

3.2.2罗马转写向圈点满文转换算法

3.2.3转换算法的实现

3.3本章小结

第四章满文文字识别预处理

4.1二值化处理

4.2倾斜校正

4.2.1图像的倾斜检测

4.2.2图像的旋转

4.3版面分析

4.3.1版面分析的对象与任务

4.3.2版面分析的方法

4.3.3基于投影的版面分析

4.4满文单字识别预处理

4.4.1噪声过滤

4.4.2细化

4.4.3剪枝

4.5本章小结

第五章满文文字识别

5.1满文文字识别系统结构

5.2基于笔划基元的满文单字识别

5.2.1笔划基元的划分与提取

5.2.2笔划基元的特征提取与识别

5.2.3游离笔划的识别

5.2.4满文基元的组合识别

5.3基于二级于结构引导的满文识别

5.4基于WNN的满文连接笔划识别

5.4.1小波神经网络

5.4.2网络的具体训练算法

5.4.3基于WNN的笔划识别

5.5测试与实现

5.6本章小结

第六章满文文字识别后处理

6.1文字识别后处理的原理和方法

6.1.1后处理的重要性

6.1.2对单字识别器输出的要求及其描述

6.1.3基于词匹配的文字识别后处理

6.1.4基于句法-语义分析的后处理

6.1.5基于人工神经网络的文字识别后处理

6.1.6基于统计方法的文字识别后处理

6.2基于知识基的满文识别后处理

6.2.1系统结构

6.2.2词典

6.2.3规则描述语言

6.2.4语料标注

6.2.5后处理策略

6.2.6实验结果

6.3本章小结

第七章总结与展望

7.1本文所做的工作和创新点

7.2工作展望

7.2.1满文手写文字识别方面

7.2.2用户界面识别自动化方面

7.2.3其它方面

参考文献

致谢

攻读博士学位期间所做的工作

个人简历

附录

展开▼

摘要

满族作为曾经的统治阶级,大量涉及政治、经济、文化、军事、外交、宗教、民俗、天文、地理等各个方面的资料都是用满文记载的,具有很高的史料价值和凭证作用。清史研究是当代史学研究的热点之一。如此繁多的珍贵史料,如果满语消失,很多史实再也没有解密的机会。而现在全国会说满语的不足百人,而精通书面语的不到20人,满语人才极其匮乏。目前满文的信息化处理和手写满文识别研究在国内尚属空白。 手写满文文字识别和其它手写文字识别一样,是一个非常有意义和极具挑战性的课题。其目的是通过页面理解和识别达到手写满文文档的自动录入,实现满文文本信息的存储、检索和转换等高层次处理,解决满文历史文档的再生保存和信息检索等问题,为清史研究提供先进的研究手段。 本文的主要内容包括: (1)对满文的书写特点进行研究,改进了满文罗马转写拼写规则,使之更易于普通用户输入满文。 (2)提出满文字根的概念,以此为基础构建通用满文矢量字库,使字处理程序可以直接处理满文,对满文进行排版和打印,同时也解决了满英汉等多种文字的混合排版。 (3)提出并实现了满文罗马转写输入法,解决了满文的文档手工输入问题;对满文目前存在的两种信息形式(即满文罗马转写和原始圈点满文)之间构建了双向转换功能,这样用户可以在这两种信息形式之间方便的进行转换,便于信息的交流和研究。 (4)对满文历史文档存在的典型版面进行分析,并实现文档的倾斜检测和校正功能,最终输出满文单字,方便下一步的识别处理。 (5)对手写满文识别预处理技术进行了系统地探讨,提出一套适合于满文书写特点的预处理技术,包括满文扫描文档的倾斜检测和倾斜校正,文字的行列划分、单字切分和单字提取,文字的去噪和细化处理等。 (6)对满文的统计特征和结构特征进行了详细的研究和系统分析,提出了满文的笔划基元概念,在此基础上建立满文笔划基元的分割、提取、特征提取和识别,以及笔划基元的组合识别方法;并在构建满文的二级子结构以及采用WNN对满文笔划基元识别方面进行了较深入地研究。 (7)通过研究目前常用文字后处理方法,提出了基于语料和规则相结合满文识别后处理方法,并取得了良好的实验效果;对于HMM后处理方法在满文识别中的应用也进行了一定深度的研究。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号