声明
摘要
图目录
表目录
第一章 序言
1.1 研究背景
1.2 国内外研究现状
1.3 本文研究内容与组织结构
第二章 蒙古文文档图像版面分析总体技术路线
2.1 版面分析的技术路线
2.1.1 自顶向下法
2.1.2 自底向上法
2.1.3 综合法
2.2 蒙古文文档图像的特点
2.3 蒙古文文档图像版面分析的方法路线和主要任务
2.4 本章小结
第三章 基于综合法的蒙古文文档图像版面分析方法
3.1.1 图像灰度化处理
3.1.2 图像二值化处理
3.2 蒙古文文档图像的模糊处理
3.3.1 搜索连通域
3.3.2 合并连通域
3.3.3 去除非文字区域
3.4 去除页码
3.4.1 图像去噪
3.4.2 去除页码
3.5 段落划分
3.6 标记位置
3.7 本章小结
第四章 基于词典的蒙古文字识别后处理技术
4.1 识别后处理的技术路线
4.2 获取蒙古文字形编码
4.2.1 整理样本数据集
4.2.2 构建分类器模型
4.2.3 通过分类器获取字形编码
4.3.1 构建编码转换词典
4.3.2 人工校正
4.3.3 编码转换过程
4.4 本章小结
第五章 实验结果与分析
5.1 版面分析实验结果
5.2 获取字形编码时分类器训练实验结果
第六章 总结与展望
6.1 总结
6.2 展望
参考文献
致谢