用python写一爬虫,需要模拟登陆,并且有数字验证码.通过selenium+pytesseract+PIL可以实现验证码识别并登陆.三大步: 用selenium截屏,此时截取的是整个页面的 用PIL库中的Image库,从刚才页面截屏中,通过crop()方法截取 出来验证码图片,然后进行灰度和二值化处理 用pytesseract库中的image_to_srting()方法,将图片转化为字符串.切割之后,转为数字. 具体实现的代码如下,需要先安装一下相应的库哦. # coding=utf-8 fr…