首页> 中文学位 >基于Gabor滤波器的通用文本验证码破解方法
【6h】

基于Gabor滤波器的通用文本验证码破解方法

代理获取

目录

声明

插图索引

表格索引

符号对照表

缩略语对照表

第一章 绪论

1.1研究背景

1.2国内外研究现状

1.3研究内容与组织结构

第二章 相关理论和技术

2.1预处理技术

2.2 Gabor滤波器

2.3 K最近邻算法

2.4卷积神经网络

2.5本章小结

第三章 文本验证码识别

3.1概述

3.2提取笔画块

3.3组合识别

3.4本章小结

第四章 文本验证码识别工作对比

4.1图搜索算法对比

4.2笔画块提取方向对比

4.3滤波器对比

4.4分类器对比

4.5与先前工作对比

4.6本章小结

第五章 实验结果与分析

5.1实验结果分析

5.2实验方法的应用

5.3破解方法评估

5.4验证码安全性分析

5.5本章小结

第六章 总结与展望

6.1本文工作总结

6.2进一步工作方向

参考文献

致谢

作者简介

展开▼

摘要

验证码现在被广泛应用于互联网上,其被用于抵制黑客的攻击以及恶意破解密码的自动化程序等。验证码的作用在于能够自动区分人类和计算机,从本质上讲验证码就是一种能够生成人类可以轻易通过而计算机却无法通过的测试。目前应用最广泛的验证码依然是文本验证码,所以针对基于文本验证码的破解仍旧是当前该领域最为广泛讨论的话题。
  截至目前已经提出了许多破解方法,这些先进的研究技术增加了验证码的鲁棒性,但是其中的大多数都有一定的局限性。本文提出了一种简单有效并且通用的方法用于破解大多数文本验证码。本文提出的破解方法只包含两大步骤,分别为提取笔画块和组合识别。首先,在提取笔画块的过程中主要使用Log-Gabor滤波器分别从四方向上对一张验证码图片进行滤波处理。其次,在组合识别的过程中需要先将提取出的笔画块按照最左上的像素进行排序,之后按照已经排序好的笔画块建立相应的图,并对图中冗余节点进行剪枝操作。在删除冗余后将剩余笔画块进行组合识别,在将笔画块识别为当个字符时主要使用到了K最近邻算法,对比了卷积神经网络,该算法在识别过程中性能最好。最后对识别出的字符进行图搜索,这里使用DP算法计算出置信度最大的识别结果,作为最终一张验证码图片的识别答案。
  在实验的过程中本文分别从图搜索算法、笔画块提取方向、滤波器、分类器以及与先前工作进行了对比,充分证实了文中方法的可行性和优越性。同时,为了强调方法的简单性,区别于传统的验证码破解工作,本文对所有验证码机制均不进行预处理操作。在提取笔画块的过程中本文首次提出将Log-Gabor滤波器用于破解验证码的工作,这是一次创新。而在组合识别的过程中本文最终选择了K最近邻算法,该算法并不需要使用样本集进行训练,能够节约大量的时间消耗,并且在识别过程中其性能最好。
  为了强调方法的有效性和通用性,本文将该方法运用到破解各种设计风格的文本验证码,包括空心验证码机制、字符分离验证码机制、以及字符粘连验证码机制等。为了获得不同风格的文本验证码,本文选择了破解Alexa排行榜最受欢迎的20个主流网站上部署的验证码,比如谷歌、雅虎、微软以及亚马逊等。对于所有不同种类的验证码机制,本文方法的破解率从5%到77%不等。本文不仅在破解成功率上获得了相对较高的结果,而且还在破解速度上也有所突破,文中破解一个文本验证码的速度均不超过15秒。除了上述验证码机制,为了更加深入的分析和验证文中提出方法的通用性,文中还选择破解了验证码研究领域内公认较难破解的验证码机制,包括较早版本的reCAPTCHA机制、Yandex验证码机制以及较难版本的Yahoo!验证码机制,均获得了一定的成功率。
  除此之外,通过分析文本验证码的安全性,本文为后续设计更加安全的验证码机制提出了宝贵的建议和意见。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号