1. 需求 因为项目需要,需要多次登录某网站抓取信息.所以学习了验证码的一些小知识.文章参考http://blog.csdn.net/problc/article/details/5794460的部分内容. 需要程序识别的验证码格式如图所示:,这个图片符合固定大小,固定位置,固定字体,固定颜色的范围,实现起来相对简单. 验证码识别基本分四步,图片预处理,分割,训练,识别.为便于演示,我这里分更多的步骤. BTW: 如果是形如:的验证码,请参考:http://blog.csdn.net/probl