1.要写一个微博爬虫,得分开几个模块来做: (1)模拟登录 (2)模拟浏览 (3)针对短时间内大量访问而引起怀疑的禁止登陆解决方案 (4)其他 (1)模拟登陆模块 前提:要模拟登录,得首先知道在登录微博的时候,每一次的HTTP请求中都包含了什么信息,于是,可以利用fiddler结合浏览器(chrome除外)来观察每个请求包信息 过程: (一)在浏览器输入:weibo.com,截获如下操作: 可以看到这个过程中,有一次尤为重要的HTTP请求:GET /sso/prelogin.php 也就是登陆前…