代码拉取完成,页面将自动刷新
基于Python使用SVM识别简单的验证字符串的完整代码开源分享。
因为目前有了更厉害的新技术来解决这类问题了,但是本文作为初级入门方法,还是具有一定的学习意义的,所以就将源码和相关的素材开源出来。
本文虽然已经不具备太强的实战性和迁移性,但是主要希望能够是以一个有趣的应用点来让对机器学习有兴趣的同学找到入门点。
上面提到的 “更厉害的新技术” 是指 “CNN 卷积神经网络”,这个工具基本上免去了本文介绍的繁杂的图片预处理工作, 而且通用性更强,换一种验证模式,基本上不需要修改任何代码,就可以训练出想要的模型。 但是这部分入门门槛会稍微高一些,后续有机会,会逐渐开一个专题来讲此类高级方法。
总之,最后会有一个结论:传统的字符验证码是完全没有防御自动化的能力了。
输入图片:
输出字符串:
6937
奉上完整的识别的源码项目:
https://github.com/zhengwh/captcha-svm
代码有些丑,但是结合原理文档,应该还算是比较清晰的。
关于原理文档请参考博客:
《字符型图片验证码识别完整过程及Python实现》
http://www.cnblogs.com/beer/p/5672678.html
效果:可以对简单的可分割的验证码达到99%以上的识别率。
因为数据包比较大,就不放上来了
整个学习的过程,主体数据处理部分是一个不断的把信息降维处理的过程。
以图片 6987 为例子:
如果有对相关技术有持续关注的兴趣的同学,欢迎加入QQ群: 592109504
或者手机QQ扫码加入:
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。