基于稀疏编码特征的场景文本识别方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

场景文本识别主要研究的内容是识别出自然场景环境下拍摄的图像中所包含的文本。自然场景文本包括路牌、商业广告、杂货店店面和车牌号码等。随着计算机技术的发展，尤其是智能手机和数码相机的发展，先进的数码设备越来越在人民群众中普及，准确地识别图像中的文本也变得越来越有应用价值，这也促使了更多的研究人员投入到这项研究中来。
　　本文主要描述了一种有效的基于稀疏编码特征的场景文本识别方法，即稀疏编码直方图特征(HSC)。整个识别方法分为单字识别以及单词识别两个阶段。在单字识别阶段，本文提出使用HSC特征代替梯度方向直方图(HOG)特征，HSC特征相比于HOG特征，能更详细表示图像的结构信息，在不增加时间复杂度的同时，又有效地提高了识别的精确度。在HSC特征的提取过程中，首先学习得到字典，该字典用来计算图像上每个像素的稀疏编码。字典的学习使用K-SVD分解方法，并按照类似HOG特征提取的方法聚集每个像素的稀疏编码形成局部直方图。在单词识别阶段，使用动态规划方法搜索最优匹配以得到识别结果。在动态规划的目标函数中集成了多种信息，包括候选字符区域的每个类的字符识别分数、候选字符区域之间的几何关系和单词包含的字符数。在搜索前，预先给定一定数量的单词，最终的识别结果是通过搜索所有给定单词中对应于目标函数最大值的路径得到。这个路径上的每一个点就是一个字符候选区域，最后顺序连接起来形成最终结果。目标函数中的参数通过最小分类错误(MCE)的训练方法学习得到。在ICDAR2003、ICDAR2011和SVT这三个国际通用数据库中的实验表明，基于稀疏编码直方图特征的场景文本识别方法明显优于基于梯度方向直方图的识别方法，并取得了较高的识别率。

著录项

作者
章冬;
展开▼
作者单位

厦门大学;

展开▼
授予单位厦门大学;
学科计算机应用技术
授予学位硕士
导师姓名王菡子;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP391.43;
关键词
场景文本识别; 稀疏编码特征; 目标函数; 精确度控制;

相似文献

中文文献
外文文献
专利

1. 基于HOG特征的稀疏编码手语识别方法研究 [J] . 牟郁 ,郭莹 . 微处理机 . 2020,第005期
2. 基于空间约束多特征联合稀疏编码的遥感图像标注方法研究 [J] . 郑歆慰 ,胡岩峰 ,孙显 . 电子与信息学报 . 2014,第008期
3. 基于层次自注意力的高效场景文本识别 [J] . 陈瑛 ,陈平平 ,林志坚 . 无线电工程 . 2022,第1期
4. 基于STN-CRNN的自然场景英文文本识别研究 [J] . 汪洪涛 ,李魁 ,潘昊 . 武汉理工大学学报（信息与管理工程版） . 2021,第006期
5. 基于矫正网络的场景文本识别应用与研究 [J] . 赵高照 ,丁学明 . 智能计算机与应用 . 2020,第012期
6. 基于语料库统计方法在汉字文本识别应用中的若干问题 [C] . 夏莹 . 全国第四届计算机语言学联合学术会议 . 1997
7. 基于YOLO的自然场景图像文本识别方法研究 [A] . 张雪 . 2020

基于稀疏编码特征的场景文本识别方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅