因为总是忘记签到,所以尝试写了一个签到脚本,因为使用的是Python3,所以没法使用Urllib2,于是选择了Requests,事实证明,Requests比Urllib2好用。整体思路比较简单,就是模拟百度登陆的过程进行交互,然后获取COOKIES并保存,之后都使用COOKIES登陆,然后模拟贴吧客户端的收发包过程进行交互,但实际上遇到了非常多的问题,这里就记录下这次的调试经验

主程序比较简单,就是判断是否登陆成功,然后开始签到,其中判断登陆是否成功时,参考的程序中用的是访问此地址检测状态值

http://tieba.baidu.com/i/i/forum?&pn=1

用浏览器抓包查看是返回302自动跳转,不过就算程序里加入allow_redirects=False,返回值也是200,所以笔者改用了贴吧主页

https://tieba.baidu.com

然后检测是否有关键字“我爱逛的贴吧”

获取贴吧列表时,绝大部分程序都使用的是此地址来获取贴吧列表

http://tieba.baidu.com/f/like/mylike?&pn=

然后还需翻页,但笔者在测试时发现此网址并没有相应的列表,并且在网页中直接打开时有时也没有任何数据,所以在github上翻阅许多代码最后找到这个地址,目前不清楚每页最多能容纳多少贴吧(测试数量为120),如果出现问题可以反馈给笔者

http://tieba.baidu.com/mo/m?tn=bdFBW&tab=favorite

签到时就是获取贴吧的fid值和tbs值进行post,前两个值可以在访问网页版对应贴吧获取(实际上可以是定值,这个参数不是必需的,为了安全稳定,还是选择尽量正确、完整地post信息),根据返回值里面的error_code就可以获得签到情况,为了防止向已签到的贴吧post签到信息(尽管post了只会返回不同的error_code,但不清楚是否会有风险),在签到之前加了一个检验,就是访问网页版对应的贴吧,然后找到对应的关键字,这里用的是Python3自带的正则表达式库re,如果熟悉Beautifulsoup可以使用这个库来实现,并且连续访问速度不能过快,否则会返回错误代码(网页版签到会弹验证码,客户端没有验证码,暂时不知道会不会有其他问题,为了不被反爬虫(笔者被反爬虫过),签到不同贴吧之间加了个随机的延迟,需要大于0.5s)

模拟客户端签到时post的信息需要进行一次加密(网页版不需要),这个是直接移植的参考代码,笔者没有亲自抓包测试,所以不做讲解,笔者尝试去掉加密代码,发现无法签到

上面的是带COOKIES的访问,其中最重要的一条就是BDUSS,这个是百度登陆成功时返回的COOKIES(同时会返回sToken、pToken等COOKIES,但不是必需的),甚至仅有这一条COOKIES就可以登陆百度,所以身份认证中最重要的就是BDUSS(但不是绑定的,新的COOKIES登陆就会产生新的BDUSS),下面写下获取BDUSS的过程

登陆百度这段代码是卡了最长时间的,因为。。。众说纷纭,做了太多无用的尝试

登陆时需要先访问百度首页,然后访问登陆界面,获取这两个的COOKIES(仅访问登陆界面也是可以的),因为正常用网页登陆时是一步一步点进去的,而不可能是直接post信息,所以在没获得前两个网页的COOKIES的情况下直接post是非法的(要先获得一个COOKIES,BAIDUID),然后带着COOKIES去访问百度的api页面获取Token(没有访问前面页面的COOKIES获取到的是the fisrt two args should be string type:0,1!意味着缺少信息),获取之后带着账密和Token令牌post就可以了(这里的headers是特殊的,参见代码,用普通的headers无法登陆),然后根据返回值error判断是否有验证码(基本都有),然后下载验证码放入一个gif文件并打开,手动输入验证码然后带着验证码标签和验证码内容再post,然后根据返回值判断情况(注意千万不要输错密码,多次错误会被锁定3小时!)如果登陆成功保存COOKIES即可,下次就只需带COOKIES登陆,并且每次登陆之后都会刷新和自动保存新COOKIES,目前不清楚多久会失效,目前来看半年内不会过期,从COOKIES文件来看有效期长达数年

在模拟post的过程中,发现抓包得到的post信息相比参考代码多了很多,于是查找了相关资料,当时参考了这篇文章,写了很长一段繁琐的代码,最后发现这些参数不是必需的。。。只当是练手罢了

https://www.cnblogs.com/qiyeboy/p/5722424.html

本文记录了开发过程中遇到的一些问题以及心得体会,代码托管在在GIT上,欢迎提供宝贵意见与建议

https://github.com/Pyrokine/tieba_autosign

感谢以下GEEKS

百度贴吧自动签到 https://github.com/chaonet/baidu_tieba_auto_sign

模拟登录百度做一些事 http://blog.csdn.net/programmer_sir/article/details/38961109

更新时间:2018.07.20,GIT同步更新到V1.2版

基于Python3+Requests的贴吧签到助手的更多相关文章

  1. Python3 + requests + unittest接口测试

    一.缘 起 笔者最近完成了基于Python3 + requests + unittest的接口测试脚本,故在此做一下记录,于己为复盘,于彼为学习和参考 二.思 路 接口测试无非三步: 首先,造数据 - ...

  2. python3+requests:接口自动化测试(二)

    转载请注明出处:https://www.cnblogs.com/shapeL/p/9188495.html 前言:上篇文章python3+requests+unittest:接口自动化测试(一):ht ...

  3. 基于Python3(Autosub)以及Ffmpeg配合GoogleTranslation(谷歌)为你的影片实现双语版字幕(逐字稿)

    原文转载自「刘悦的技术博客」https://v3u.cn/a_id_169 为影片加字幕其实是一件非常耗费时间的事情,尤其是对于打字慢的朋友来说.当然不光为影片加字幕,在其他领域,类似的逐字稿也是工作 ...

  4. Sublime Text 2 (for OS X )配置成可以运行基于python3解释器的 .py文件

    Mac自带的python 其version是python 2.7 官网下的Sublime Text 2部署好了以后默认也是 为了使ST2 可以在command+B时可以运行基于python3的.py, ...

  5. 基于Python3的漏洞检测工具 ( Python3 插件式框架 )

    目录 Python3 漏洞检测工具 -- lance screenshot requirements 关键代码 usage documents Any advice or sugggestions P ...

  6. python3+requests库框架设计01-自动化测试框架需要什么?

    什么是自动化测试框架 关于自动化测试框架的定义有很多,在我大致理解下就是把能实现不同功能的软件组合在一起,实现特定的目的,这就是一个简单的自动化测试框架. 接口自动化测试框架核心无非是选择 一个用来编 ...

  7. 【python3+request】python3+requests接口自动化测试框架实例详解教程

    转自:https://my.oschina.net/u/3041656/blog/820023 [python3+request]python3+requests接口自动化测试框架实例详解教程 前段时 ...

  8. 基于Python3 + OpenCV3.3.1的远程监控程序

    基于Python3 + OpenCV3.3.1的远程监控程序 一.环境配置 OpenCV是一个基于(开源)发行的跨平台计算机视觉库,利用OpenCV能够实现视频图像的捕获. 关于python3中Ope ...

  9. 基于Python3 神经网络的实现

    基于Python3 神经网络的实现(下载源码) 本次学习是Denny Britz(作者)的Python2神经网络项目修改为基于Python3实现的神经网络(本篇博文代码完整).重在理解原理和实现方法, ...

随机推荐

  1. Apache Kafka主题 - 架构和分区

    1.卡夫卡话题 在这篇Kafka文章中,我们将学习Kafka主题与Kafka Architecture的整体概念.Kafka中的体系结构包括复制,故障转移以及并行处理.此外,我们还将看到创建Kafka ...

  2. [hdu 4841]圆桌问题 | 约瑟夫问题 STL-vector

    原题 问题描述: 经典的约瑟夫问题,有2n个人,其中n个好人n个坏人,使得删去n人后,剩下的全为好人.m为每次数的人数. n<=32767 题解: 首先考虑n的范围,暴力肯定行不通,所以会想到线 ...

  3. 函数的学习2——返回值&传递列表——参考Python编程从入门到实践

    返回值 函数并非总是直接显示输出,相反,它可以处理一些数据,并返回一个或一组值.函数的返回值被称为返回值. 1. 简单的返回值 def get_formatted_name(first_name, l ...

  4. Java线程的等待与唤醒完整示例代码

    项目结构: 资源类: 输入线程:  输出线程: 测试: 人妖问题发生: 线程安全问题的解决方法: 调用Object的wait()和notify()方法时需注意:必须是锁对象方可调用,否则将抛出无效的监 ...

  5. Java代码生成器Easy Code

    EasyCode是基于IntelliJ IDEA开发的代码生成插件,支持自定义任意模板(Java,html,js,xml).只要是与数据库相关的代码都可以通过自定义模板来生成.支持数据库类型与java ...

  6. jwt 0.9.0 系列目录

    jwt官网地址:https://jwt.io/ PS: 写此系列的时候,jjwt jar包版本是0.9.0 <dependency>    <groupId>io.jsonwe ...

  7. [LOJ#3119][Luogu5400][CTS2019]随机立方体(容斥+DP)

    https://www.cnblogs.com/cjyyb/p/10900993.html #include<cstdio> #include<algorithm> #defi ...

  8. 同一个Tomcat部署多个springboot项目问题

    2018-12-13 10:37:21,412 ERROR [localhost-startStop-2] c.a.d.s.DruidDataSourceStatManager [DruidDataS ...

  9. thinkPHP中session()方法用法详解

    本文实例讲述了thinkPHP中session()方法用法.分享给大家供大家参考,具体如下: 系统提供了Session管理和操作的完善支持,全部操作可以通过一个内置的session函数完成. 用法 ? ...

  10. MongoDB 3.6.1集群部署

    Mongodb安装 Linux版本:CentOS release 6.9 Mongodb版本:mongodb-linux-x86_64-3.6.1.tgz 示例是在一台主机上安装mongodb集群 端 ...