模拟登陆github

import requests

from lxml import etree

class Login(object):

    def __init__(self):

        self.headers = {

            'Referer': 'https://github.com/',

            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.133 Safari/537.36',

            'Host': 'github.com'

        }

        self.login_url = 'https://github.com/login'

        self.post_url = 'https://github.com/session'

        self.logined_url = 'https://github.com/settings/profile'

        self.session = requests.Session()  #方便请求头cookie的处理

    def token(self):

        response = self.session.get(self.login_url, headers=self.headers)

        selector = etree.HTML(response.text)

        token = selector.xpath('//div//input[2]/@value')

        return token

    def login(self, email, password):

        post_data = {

            'commit': 'Sign in',

            'utf8': '✓',

            'authenticity_token': self.token()[0],

            'login': email,

            'password': password

        }

        response = self.session.post(self.post_url, data=post_data, headers=self.headers)

        if response.status_code == 200:

            self.dynamics(response.text)

        response = self.session.get(self.logined_url, headers=self.headers)

        if response.status_code == 200:

            self.profile(response.text)

    def dynamics(self, html):

        selector = etree.HTML(html)

        dynamics = selector.xpath('//div[contains(@class, "news")]//div[contains(@class, "alert")]')

        for item in dynamics:

            dynamic = ' '.join(item.xpath('.//div[@class="title"]//text()')).strip()

            print(dynamic)

    def profile(self, html):

        selector = etree.HTML(html)

        name = selector.xpath('//input[@id="user_profile_name"]/@value')[0]

        email = selector.xpath('//select[@id="user_profile_email"]/option[@value!=""]/text()')

        print(name, email)

if __name__ == "__main__":

    login = Login()

    login.login(email='cqc@cuiqingcai.com', password='password')

模拟登陆github的更多相关文章

Python爬虫教程：requests模拟登陆github
1. Cookie 介绍 HTTP 协议是无状态的.因此,若不借助其他手段,远程的服务器就无法知道以前和客户端做了哪些通信.Cookie 就是「其他手段」之一. Cookie 一个典型的应用场景,就是 ...
python模拟登陆Github示例
首先进入github登录页:https://github.com/login 输入账号密码,打开开发者工具,在Network页勾选上Preserve Log(显示持续日志),点击登录,查看Sessio ...
模拟登陆Github示例
首先进入github登录页:https://github.com/login 输入账号密码,打开开发者工具,在Network页勾选上Preserve Log(显示持续日志),点击登录,查看Sessio ...
Python爬虫学习笔记之模拟登陆并爬去GitHub
(1)环境准备: 请确保已经安装了requests和lxml库 (2)分析登陆过程: 首先要分析登陆的过程,需要探究后台的登陆请求是怎样发送的,登陆之后又有怎样的处理过程. 如果已经 ...
模拟登陆并爬取Github
因为崔前辈给出的代码运行有误,略作修改和简化了. 书上例题,不做介绍. import requests from lxml import etree class Login(object): def ...
pytho简单爬虫_模拟登陆西电流量查询_实现一键查询自己的校园网流量
闲来无事,由于校园内网络是限流量的,查询流量很是频繁,于是萌生了写一个本地脚本进行一键查询自己的剩余流量. 整个部分可以分为三个过程进行: 对登陆时http协议进行分析利用python进行相关的模拟 ...
使用webdriver+urllib爬取网页数据(模拟登陆，过验证码)
urilib是python的标准库,当我们使用Python爬取网页数据时,往往用的是urllib模块,通过调用urllib模块的urlopen(url)方法返回网页对象,并使用read()方法获得ur ...
第三百四十三节，Python分布式爬虫打造搜索引擎Scrapy精讲—scrapy模拟登陆和知乎倒立文字验证码识别
第三百四十三节,Python分布式爬虫打造搜索引擎Scrapy精讲—scrapy模拟登陆和知乎倒立文字验证码识别第一步.首先下载,大神者也的倒立文字验证码识别程序下载地址:https://gith ...
python-爬虫之requests模块介绍（登陆github）
介绍使用requests可以模拟浏览器的请求,比起之前用到的urllib,requests模块的api更加便捷(本质就是封装了urllib3) 注意 requests库发送请求将网页内容下载下来以后 ...

随机推荐

EJS 语法
教程
一。Hibernate 开发流程
一.hibernate和mybatis都是orm产品1.orm:object-realation-mapping对象关系映射二.开发步骤1.导入相关jar 包括hibernate和oracle的驱动 ...
使用Builder模式创建复杂可选参数对象
在新建对象时,若需要对大量可选参数进行赋值,最常见的做法是JavaBeans模式,即调用一个无参构造方法创建对象,然后调用setter方法来设置每个必要的参数,以及每个相关的可选参数.代码示例如下: ...
springIOC原理加载过程
关于spring ,我以前学过很多次,也看过很多的书.以及博客,但是总是不得要领,这次我再学习一遍,在这里做点记录,如果不对的地方还请大家指正 Ioc: inverse of controller 控 ...
Make a Person 闭包
用下面给定的方法构造一个对象. 方法有 getFirstName(), getLastName(), getFullName(), setFirstName(first), setLastName(l ...
oracle篇之排序、限制查询行
第二章:排序.限制查询行一.order by子句 1．order by排序规则 (1)asc,升序排列,默认取值 (2)desc,降序排列 (3)order by是select命令的最后一个子句 s ...
odoo10源码 windows环境安装
odoo10-windows开发环境(源码安装) 安装node 下载地址 http://nodejs.cn/download/ 安装教程https://www.cnblogs.com/zhouyu20 ...
ftp服务器安装与配置
ftp服务器安装与配置 1. ftp服务端的安装 1 如果之前配置过ftp服务器的还是之后配置的服务器,无法启动服务,那么基本是配置出现了错误,那么可先完全卸载后再进行安装.如果无法定位多半是镜像源的 ...
Java 删除ArrayList中重复元素，保持顺序
// 删除ArrayList中重复元素,保持顺序 public static List<Map<String, Object>> removeDuplicat ...
List根据对象的两个字段进行排序，并且有一个倒序
用java8 的lambda 表达式 list.sort(Comparator.comparing(Live::getId) .thenComparing(Live::getAppId, Compar ...

模拟登陆github

模拟登陆github的更多相关文章

随机推荐

热门专题