自然场景中文本信息提取方法
APPROACHES TO TEXT INFORMATION
摘 要
Abstract
目 录
Contents
第1章 绪论
1.1 课题的研究目的和意义
1.2 自然场景中的文本认知
1.2.1 自然场景中的文本区域图像特征
1.2.2 自然场景中的文本类型
1.2.3 自然场景中文本的特点
1.2.4 文本信息提取问题描述
1.2.5 文本信息提取与光学字符识别系统的关系
1.3 国内外研究现状及分析
1.3.1 基于连通域分析的文本信息提取方法
1.3.2 基于边缘特征的文本信息提取方法
1.3.3 基于纹理特征的文本信息提取方法
1.3.4 基于学习的文本信息提取方法
1.3.5 压缩域中文本信息提取方法
1.3.6 其他文本信息提取方法
1.4 文本信息提取存在的问题和发展趋势
1.5 本文的研究内容
第2章 基于小波重构映射的文本检测
2.1 引言
2.2 小波的概念
2.3 二维图像的小波分解和重构
2.4 基于小波重构映射的文本检测
2.4.1 属性特征提取
2.4.2 基于神经网络的文本检测分类器
2.5 边缘映射与小波重构映射的性能比较
2.5.1 可分性判据
2.5.2 文本检测性能对比
2.6 实验结果与分析
2.6.1 文本检测评价方法
2.6.2 特征检测窗口大小的选择
2.6.3 特征检测窗口滑动步长的选择
2.6.4 分类器输出二值化阈值的选择
2.6.5 分类器训练样本属性比例的选择
2.6.6 边缘映射与小波重构映射比较
2.7 本章小结
第3章 基于模糊同质性映射的文本检测
3.1 引言
3.2 同质性映射
3.3 模糊同质性映射
3.3.1 图像的模糊化处理
3.3.2 模糊同质性映射
3.4 模糊同质性的改进
3.4.1 模糊纹理信息的计算
3.4.2 模糊边缘信息的计算
3.5 基于同质映射和模糊同质映射的文本检测
3.5.1 特征提取
3.5.2 基于SVM 的文本检测
3.5.3 核函数及参数选择
3.5.4 SVM 的训练样本属性比例
3.5.5 分类器性能对比
3.6 实验结果和分析
3.6.1 特征检测窗口大小的选择
3.6.2 特征检测窗口滑动步长的选择
3.6.3 同质性映射和模糊同质性映射性能验证
3.6.4 改进模糊同质性映射性能验证
3.6.5 与第2 章文本检测方法的比较
3.7 本章小结
第4章 基于文本像素密度的文本定位
4.1 引言
4.2 文本定位的评价方法
4.2.1 精确率和召回率
4.2.2 文本定位的评价准则
4.3 文本定位
4.3.1 基于文本像素密度的文本定位方法
4.3.2 文本定位后处理
4.4 基于多分辨分析的文本定位
4.4.1 多分辨分析方法
4.4.2 基于多分辨分析的文本定位
4.5 文本定位方法的比较与分析
4.5.1 实验结果
4.5.2 结果分析
4.6 本章小结
第5章 基于多尺度变换与模板匹配的文本提取
5.1 引言
5.2 字符分割方法
5.3 多尺度变换
5.4 基于多尺度模板匹配的文本提取方法
5.4.1 匹配准则函数
5.4.2 多尺度模板匹配算法
5.5 TMAMT 算法在车牌精确定位与字符分割中的应用
5.5.1 车牌模板及尺度变换参数
5.5.2 车牌精确定位与字符分割中匹配准则函数
5.5.3 多尺度模板匹配的车牌精确定位与字符分割
5.5.4 实验结果及分析
5.6 本章小结
结 论
参考文献
攻读博士学位期间发表的学术论文
哈尔滨工业大学博士学位论文原创性声明
哈尔滨工业大学博士学位论文使用授权书
致 谢
图表索引
Index of Figures and Tables
个人简历