爬虫主要目的是获取数据,常见的数据可以直接访问网页或者抓包获取,然后再解析即可. 一些较为隐私的数据则不会让游客身份的访问者随便看到,这个时候便需要登录获取. 一般获取数据需要的是登录后的cookie作为身份验证,如果一个可用cookie就能满足你的爬虫需要,可以不用模拟登录, 直接在网页上登录,拷贝cookie下来,写死在代码中. 其他的情况可能需要代码帮你登录,然后获取登录的cookie,再去访问你需要的数据. 首先,你需要有一个帐号(或者多个,当你想大量访问数据而cookie又有限制时.)…