文摘
英文文摘
声明
第一章概述
1.1引言
1.2文本页面处理和数学表达式处理
1.2.1页面分割算法的现状
1.2.2数学表达式的处理研究
1.3本文的结构及所做的工作
第二章基于微结构的文本元分类及页面校正
2.1页面图像的预处理
2.2页面的微结构描述
2.2.1文本元的形成
2.2.2文本元分类
2.2.3部分文本元分析
2.3文本页面倾斜校正
2.3.1基线特征点的选取
2.3.2基线特征点划分及剔除
2.3.3最小二乘法求基线
2.3.4快速校正算法
2.4倾斜校正的结果
第三章页面文本行分割与数学表达式定位
3.1页面结构类型
3.2常用的分割策略
3.2.1自上而下的分析策略
3.2.2自底向上的分析策略
3.2.3混合的分割策略
3.3本文的分割算法
3.3.1页面分割目标
3.3.2基于微结构及投影的页面分割
3.4数学表达式定位
3.4.1独立表达式行的定位
3.4.2基于最小错误率的分类器设计
3.4.3内嵌表达式的定位
3.4.4文本行上下基线分析
3.4.5连通体提取
3.5数学表达式定位结果讨论
第四章表达式结构分析和字符切分
4.1数学表达式结构分析
4.1.1表达式的位置关系
4.1.2表达式细化处理
4.1.3结构分析策略
4.2字符切分
4.2.1文本行字符切分
4.2.2表达式字符切分
4.2.3基于连通体的切分算法
4.2.4字符切分结果
4.3识别前的预处理
第五章结论与展望
5.1本文算法讨论
5.1.1页面前景像素的描述算法
5.1.2页面倾斜校正算法
5.1.3数学表达式定位算法
5.1.4表达式分析算法
5.2总结
参考文献
攻读硕士学位期间发表的论文和取得的科研成果
致谢