首页> 中文学位 >基于语音提示和文字识别的无障碍移动电子书朗读器的研究与实现
【6h】

基于语音提示和文字识别的无障碍移动电子书朗读器的研究与实现

代理获取

目录

声明

摘要

图目录

第1章 绪论

1.1 课题背景

1.2 研究意义和目的

1.3 论文组织

1.4 本章小结

第2章 系统相关技术

2.1 Android操作系统的辅助功能

2.1.1 Android操作系统

2.1.2 Android操作系统的辅助功能

2.2 移动电子书朗读器之分页与朗读

2.2.1 分页之ViewPager

2.2.2 朗读之TTS

2.2.3 电子书朗读器的市场调研

2.3 文字图片识别

2.3.1 OCR基础

2.3.2 百度开源OCR

2.3.3 Google OCR之Tesseract

2.3.4 OpenCV For Android

2.4 本章小结

第3章 基于话语提示以及中文词库的无障碍朗读

3.1 基于“触摸反馈”和“话语提示”的控制模块

3.1.1 “单击悬停,双击确认”操作模式

3.1.2 “单指滑动”阅读操作

3.1.3 丰富的智能“话语提示”

3.2 基于中文词库的无障碍朗读模式

3.2.1 朗读模式的需求调查

3.2.2 提供可选的朗读速度

3.2.3 朗读模式的多样化

3.2.4 无障碍朗读—逐字朗读模式

3.3 其它功能无障碍化

3.3.1 书签操作

3.3.2 跳转操作

3.3.3 睡眠设定

3.3.4 识别阅读

3.4 本章小结

第4章 OCR识别算法的设计和改进

4.1 图片预处理

4.1.1 灰度化

4.1.2 去噪声

4.1.3 倾斜校正

4.1.4 对比增强

4.1.5 边缘检测

4.2 文字图片按行切割

4.2.1 读取灰度图

4.2.2 文字行检测

4.2.3 文字行分割

4.2.4 JPG小图的生成

4.3 完成文字图片识别

4.4 本章小结

第5章 无障碍电子书朗读器的设计与实现

5.1 项目整体架构

5.2 导入模块设计与实现

5.2.1 本地图书获取

5.2.2 网络图书获取

5.2.3 文字识别资源获取

5.3 显示与朗读模块设计与实现

5.3.1 电子书显示

5.3.2 手势操作

5.3.3 电子书朗读

5.4 存储模块设计与实现

5.4.1 数据库

5.4.2 文件

5.4.3 sharePreference

5.5 其它功能的实现

5.6 系统测试和运行效果

5.6.1 系统测试

5.6.2 实际运行效果

5.7 本章小结

第6章 总结和展望

6.1 总结

6.2 展望

参考文献

致谢

展开▼

摘要

在2006年经国务院批准我国进行了第二次全国残疾人抽样调查,根据调查结果统计,截止到2006年,我国各类残疾人的总数为8296万人,而其中视力残疾达到1233万人。视障人群由于视力方面的残疾,无法像正常人一样便捷地使用手机、平板电脑等电子产品来获取信息和知识、与他人沟通和交流。所以听觉以及触觉(盲文)是盲人以及有视力障碍人群获取信息的主要方式。而由于盲文书籍的数量有限、教学困难和读取速度较慢等原因,通过听觉的方式拓展盲人及视力障碍人群获取信息和知识的能力成为了一个重要的研究方向。移动电子书朗读器能够让视障人群仅仅通过听觉就能轻松的获取知识,而现在市面上的移动电子书朗读器几乎没有针对视障人群做过适配和优化,视障人群使用十分不便。因此,设计一款方便使用的移动无障碍电子书朗读器具有重大意义。
  本文首先针对视障人群的特点,实现了一种基于手势操作和语音提示的控制操作方式。该方法将一部分视障人群难以完成的精确点击操作变为对于操作精度要求较低的手势操作(如上下左右滑动、双击单击、摆动等),提高了视障人群操作电子书朗读器时的便利性从而降低了操作时间;对于必须精确点击的操作,简化操作流程,将原本需要多次点击的操作简化为仅需要一次操作,不仅大大减少了操作复杂程度,而且提升了用户的阅读效率。此外在用户的阅读过程中,增加了许多人性化和智能的语音提示,帮助用户更快更准确地完成阅读操作,提升用户的阅读体验。
  其次,对于朗读方式针对视障人群也提供了更个性化的选择,共有全文朗读、逐段朗读、逐句朗读和逐字朗读四种方式,对于没听清楚的句子,只要轻轻晃动手机会自动再次朗读,也可以上下滑动实现上一句下一句的切换。
  再次,针对市面上有些电子书的获取比较困难,提出了一种文字图片识别的朗读方式,文字图片识别是基于OCR算法,本文在百度开源OCR算法的基础上结合Opencv强大的图像处理能力生成了优化的OCR识别算法,使得在识别过程中没有任何图片大小和格式的限制,把该优化的算法应用在电子书朗读器中就能够轻松的实现拍照识别阅读了,也能够拍照识别保存为本地文本文件。
  最后,本文在以上研究的基础上设计并实现了Android平台上的基于语音提示和图片识别的移动无障碍电子式朗读器。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号