首页> 中文学位 >基于FPGA的盲人阅读器的设计与实现
【6h】

基于FPGA的盲人阅读器的设计与实现

代理获取

目录

声明

摘要

第1章 绪论

1.1 课题研究背景

1.2 国内外研究现状

1.2.1 OCR光学字符识别的发展历程

1.2.2 TTS语音合成技术的发展历程

1.2.3 印刷体汉字识别面临的问题和挑战

1.3 课题研究意义

1.4 论文章节安排

第2章 系统相关知识介绍

2.1 印刷体汉字识别预处理

2.1.1 文本图像灰度化

2.1.2 平滑去噪

2.1.3 文本图像二值化

2.1.4 行字切分

2.1.5 文字归一化

2.1.6 文字细化

2.2 印刷体汉字特征提取

2.3 汉字匹配识别

2.4 系统硬件开发平台

2.4.1 DE2_35开发板

2.4.2 CMOS图像传感器

2.5 系统软件开发平台

2.5.1 Quartus Ⅱ软件平台

2.5.2 Nios Ⅱ IDE软件平台

2.6 本章小结

第3章 系统总体设计

3.1 系统功能概述

3.2 系统模块构建

3.3 系统硬件设计

3.4 系统软件设计

3.5 系统总体架构

3.6 本章小结

第4章 系统各模块的具体设计与实现

4.1 图像采集模块

4.1.1 I2C传感器配置模块

4.1.2 CMOS传感器数据采集模块

4.1.3 Bayer格式转RGB格式模块

4.2 SDRAM数据缓存模块

4.3 图像显示模块

4.4 文字识别模块

4.4.1 OCR模块

4.4.2 印刷体汉字识别预处理

4.4.3 印刷体汉字特征提取

4.4.4 印刷体汉字匹配识别

4.4.5 语音转换

4.5 本章小结

第5章 系统调试及结果分析

5.1 系统调试

5.1.1 硬件调试

5.1.2 软件调试

5.2 遇到的问题及解决方法

5.3 系统测试结果及分析

5.4 系统主要性能参数

5.5 本章小结

第6章 总结与展望

6.1 论文工作总结

6.2 未来工作展望

参考文献

致谢

展开▼

摘要

在当今社会中,99%以上的文字信息都是以可视化的纸质资料形式出现的,而盲人及视力障碍人士无法像普通人一样正常读书看报,视觉能力的缺失使他们无法以最直观的方式获取信息。盲人阅读器正是一种将可视化印刷品资料转化为声音信号,可供视力障碍人群直观获取信息的设备,该设备可使其在不借助他人帮助的情况下也能够方便地获取普通纸质文字信息。基于FPGA(Field Programmable Gate Array,现场可编程门阵列)的系统可充分利用硬件上的特性满足高速图像处理的需要,加上使用SOPC(System On aProgrammable Chip,可编程片上系统)技术可使设计更加灵活,并实现软硬件在线编程及更新。
  本文设计了一个基于FPGA的盲人阅读器,以Altera公司的DE2开发板作为硬件平台,配合以CMOS(Complementary Metal Oxide Semiconductor,互补氧化金属半导体)图像传感器对纸质印刷体文字资料进行采集,VGA(Video Graphic Array,显示绘图阵列)显示器对采集图像和处理结果进行显示,当拨动相应的功能开关时,系统将通过音响输出识别文字内容后的语音信息。
  整个系统共分为图像采集、图像缓存、图像显示和文字识别四个模块。系统采用软硬件协同设计方式进行实现,其中图像采集、图像缓存和图像显示三个模块用Verilog硬件描述语言进行编写,文字识别模块通过搭建SOPC,在NiosⅡ IDE环境下采用C语言编程处理实现。其中,文字识别模块是系统的核心,关系到系统的性能。文字图像处理分为预处理、特征提取和匹配识别。本文讨论并分析了各部分算法的选取,在预处理部分采用中值滤波对灰度图像进行平滑去噪,再使用Otsu算法进行二值化处理,之后经过行字切分和归一化处理后,应用改进的八邻域细化算法提取出文字骨架。然后基于该单像素的文字骨架信息,对其包括端点、歧点、拐点及四叉点在内的特征点进行特征提取,并采用一阶Minkowski度量,即绝对距离度量,将特征向量与字典中的标准向量进行匹配识别,距离最短的即为识别结果。最后,在语音库中找到文字对应的语音文件,并通过音响输出声音信息。经过反复的调试和改进,该系统可以很好地实现盲人阅读器的功能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号