首页> 中文学位 >基于语义增强与语法规则的复杂场景文本识别算法研究
【6h】

基于语义增强与语法规则的复杂场景文本识别算法研究

代理获取

目录

声明

致谢

1 绪论

1.1 研究背景和意义

1.2 国内外研究现状

1.2.1 场景文本识别现状

1.2.2 手写中文文本识别现状

1.3 本文主要工作

1.4 本文组织结构

2 复杂场景文本识别相关工作

2.1 基础知识

2.1.1 视觉特征提取

2.1.2 语义特征提取

2.2 场景文本识别算法

2.2.1 基于一维序列的场景文本识别算法

2.2.2 基于二维视角的场景文本识别算法

2.3 手写中文文本识别算法

2.3.1 基于分割的手写中文文本识别

2.3.2 基于无分割的手写中文文本识别

2.4 本章小结

3 基于文本注意与语义增强的场景文本识别算法

3.1 整体框架

3.2 基于文本注意的视觉特征提取模块

3.3 旋转矫正网络

3.4 基于语义增强的上下文特征提取模块

3.5 并行预测

3.6 实验与结果分析

3.6.1 实验环境

3.6.2 数据集与评价指标

3.6.3 实验以及与不同模型的对比分析

3.6.4 消融实验结果与分析

3.7 本章小结

4 基于有限状态自动机的手写体大写金额识别算法

4.1 票据识别算法

4.1.1 票据预处理

4.1.2 过分割与组合

4.1.3 单字符分类器

4.2 基于有限状态自动机的语法检查器

4.2.1 大写金额语法规则

4.2.2 构建确定有限状态自动机

4.2.3 动态约束

4.2.4 路径搜索

4.2.5 模糊字符预测

4.3 实验结果与分析

4.3.1 实验数据及评价指标

4.3.2 基于有限状态自动机的语法模型效果分析

4.3.3 有限状态自动机对票据识别结果的影响

4.4 本章小结

5 总结与展望

5.1 总结

5.2 展望

参考文献

作者简历及攻读硕士学位期间取得的研究成果

独创性声明

学位论文数据集

展开▼

著录项

  • 作者

    闫茹;

  • 作者单位

    北京交通大学;

  • 授予单位 北京交通大学;
  • 学科 计算机科学与技术
  • 授予学位 硕士
  • 导师姓名 孙永奇;
  • 年度 2021
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 TP3H3;
  • 关键词

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号