这是一个我去年暑假搞的验证码识别的小项目,这会儿分享出来,希望能对有需要的同学有一定的帮助。
项目主要分为两部分,一部分是验证码的分割,另一部分是用Keras做的一个深度学习的单个字符图片的分类(即字符识别)
data
目录下配有我制作好的数据集,Model_tf.net
为预训练好的模型,predict
目录下放了些图片来做测试。
trainer.py
和predictor.py
两个文件分别训练和预测的代码。
utils.py
中主要放置分割算法的实现,即将验证码分割成单个的字符图片,本项目默认采用的是投影法。就分割算法的实现来说,可能只适用于本数据集,但思想是通的,如果有其他类似的数据集,改一改应该也是能用的。