在Python中用Request库模拟登录（四）：哔哩哔哩（有加密，有验证码）

！已失效！

抓包分析

获取验证码

获取加密公钥

其中hash是变化的，公钥key不变

其中用户名没有被加密，密码被加密。

因为在获取公钥的时候同时返回了一个hash值，推测此hash值与密码加密有关。

通过谷歌浏览器控制台分析js代码

右键登录按钮，检查，查看 Event Listeners ，点击a.btn.btn-login右边的login.4f030c3....js:6查看js代码。

点击左下角的{}展开代码

因为获取公钥和hash的链接中有action=getkey，尝试在源代码中搜索getkey，于是找到这样一个函数：

 encryptPassword: function (e, t) {
     var n = this,
     r = !1;
     return $.ajax({
         url: "https://passport.bilibili.com/login?act=getkey&r=" + Math.random(),
         async: !1
     }).done(function (t) {
         t && t.error && (n.publicTip = "登录失败，服务端出现异常", e = null);
         var i = new JSEncrypt;
         i.setPublicKey(t.key);
         var a = i.encrypt(t.hash + e);
         e = a,
         r = !0
     }),
     r ? e : ""
 }

观察第10、11行，可知hash和变量e相加后被RSA加密，现在需要确定e是什么。在第11行代码所在的位置设置一个断点，输入用户名密码验证码之后点击登录，在这里密码框输入的是‘mypassword’

点击e就会显示出e的值，看来e就是密码明文。

于是，可以猜测，加密的过程是：密码字符串前面串接hash值，然后进行RSA加密。下面通过测试检查猜测是否正确。

模拟登录

每一次请求的headers都完全复制抓包的内容。

1.获取验证码

 def get_code():
     url='https://passport.bilibili.com/captcha?r=0.1265352187487443'
     headers={复制抓包到的headers}
     session.headers.clear()
     session.headers.update(headers)
     r=session.get(url)
     file=open('code.jpg','wb')
     file.write(r.content)
     file.close()

2.getkey

 def get_key():
     url='https://passport.bilibili.com/login?act=getkey&r=0.4365052982637341'
     headers={复制抓包到的headers}
     session.headers.clear()
     session.headers.update(headers)
     r=session.get(url)
     jsondata=json.loads(r.text)
     #hash变化，key不变
     return (jsondata['hash'],jsondata['key'])

3.加密，具体可以参考博客园的模拟登录的附录部分

 def encrypt(Hash,key,password):
     from Crypto.PublicKey import RSA
     from Crypto.Cipher import PKCS1_v1_5
     from base64 import b64encode
     encryptor=PKCS1_v1_5.new(RSA.importKey(bytes(key,'utf-8')))
     return str(b64encode(encryptor.encrypt(bytes(Hash+password,'utf-8'))),'utf-8')

4.登录

 def login(code,username,password):
     #注意，在登录页面中验证码会自动转成大写
     url='https://passport.bilibili.com/web/login'
     headers={复制抓包到的headers}
     data={',
           ',
           'captcha':code,
           'user':username,
           'pwd':password,
           'keep':'true',
           'gourl':'http://www.bilibili.com/'}
     session.headers.clear()
     session.headers.update(headers)
     r=session.post(url,data=data)
     return r.text

如果登录成功，将返回 "code":0

5.测试

testurl='https://www.bilibili.com/account/dynamic'

在未登录时，testurl的标题为“bilibili - 提示”，登录时标题为“哔哩哔哩 (゜-゜)つロ干杯~-bilibili”

session.headers.clear()
r=session.get(testurl)
p=r.text.find('<title>')+len('<title>')
print(r.text[p:r.text.find('<',p)])