首页> 中文学位 >基于文字识别的敏感网络图片审查系统的设计与实现
【6h】

基于文字识别的敏感网络图片审查系统的设计与实现

代理获取

目录

声明

摘要

第一章 绪论

第一节 论文的研究背景

第二节 国内外研究的现状

1.2.1 国外研究现状

1.2.2 国内研究现状

第三节 论文的工作以及重点和难点

第四节 论文的组织结构安排

第五节 本章小结

第二章 需求分析

第一节 审查系统设计目标

第二节 系统特性需求分析

2.2.1 系统性能特性分析

2.2.2 系统功能特性分析

第三节 系统用例设计

第四节 系统软硬件环境

第五节 本章小结

第三章 系统设计与实现

第一节 系统架构设计

第二节 数据库设计

3.2.1 数据库概念结构设计

3.2.2 数据库逻辑结构设计

第三节 爬虫设计与实现

3.3.1 爬虫的基本原理

3.3.2 爬虫抓取策略

3.3.3 爬虫实现

第四节 文本识别设计与实现

3.4.1 文本识别详细设计

3.4.2 文本定位与识别实现

第五节 人工审查实现

第六节 本章小结

第四章 文字提取关键技术研究

第一节 文字提取相关工作介绍

4.1.1 基于连通体区域的方法

4.1.2 基于边缘的方法

4.1.3 基于纹理的方法

第二节 基于SIFT特征的文本预定位

4.2.1 特征提取

4.2.2 特征匹配

4.2.3 文本区域预定位

第三节 文字识别关键技术

第四节 本章小结

第五章 系统实验及分析

第一节 实验及分析

5.1.1 爬虫与数据库实验

5.1.2 SIFT特征匹配实验

5.1.3 文本区域预定位实验

5.1.4 文字识别验证实验

5.1.5 人工审查实验

第二节 本章小结

第六章 总结与展望

第一节 总结

第二节 展望

参考文献

致谢

个人简历、在学期间发表的学术论文及研究成果

展开▼

摘要

随着计算机网络共享性、开放性、互连程度的不断发展以及计算机本身的普及,如今互连网已经深深的渗透到了人们生活的各个领域。因此,如何保障人们在上网的同时不被敏感网络信息所危害就显得越来越重要,近年来随着带有敏感信息的网络图片的不断增多,对带有敏感信息的网络图片的识别和审查变得越来越重要了。
  本着帮助相关审查人员审查网络图片并屏蔽掉带有敏感图片的网站的目的,论文设计并实现了该审查系统。本系统包含了网络图片的获取和存储、图片文本区域的定位和文字识别以及人工审查三个模块。通过爬虫程序从指定的网站爬取图片,并将图片信息存储到数据库中,将图片保存到指定路径下。在文本定位时,利用SIFT算法进行特征提取和特征匹配,将爬虫保存的图片逐个读出,提取它们的SIFT特征,进行特征匹配,找到可能存在的文本区域,然后通过预定位和连通体分析方法准确定位出文本区域,并使用文字识别软件(OCR)对提取的文字进行识别,由系统将识别结果反馈给相关审查人员。审查人员在获得系统的反馈信息后,根据反馈信息的内容,对相应的网站做出相应的处理。
  通过对部分网站的测试发现,论文所做的工作能够获得网站中的图片并对部分图片的文本区域进行的正确定位,然而对于某些背景特别复杂的图片并没有很好的效果,这是本系统的文本定位算法需要在下一步作出改进的地方。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号