使用selenium模拟登陆oschina

Selenium把元素定位接口封装得更简单易用了，支持Xpath、CSS选择器、以及标签名、标签属性和标签文本查找。

from selenium.webdriver import PhantomJS

from random import randint

import time

from selenium.webdriver.common.keys import Keys

from requests.cookies import RequestsCookieJar

import requests

def savepic():

    filename = '{}-{}.png'.format(int(time.time()), randint(100, 999))

    driver.save_screenshot(filename=filename)

with PhantomJS() as driver:

    driver.set_window_size(width=1280, height=1024)

    url = 'https://www.oschina.net/home/login'

    driver.get(url=url)

    # savepic()

    username = driver.find_element_by_id(id_='userMail')

    password = driver.find_element_by_id(id_='userPassword')

    username.send_keys('user@xx.com')  # 输入用户名

    password.send_keys('password')  # 输入密码

    # savepic()

    password.send_keys(Keys.ENTER)  # 输入回车,提交表单

    time.sleep(10)

    print(driver.current_url)  # 登陆后跳转到首页

    # userinfo = driver.find_element_by_class_name(name='user-info')

    while not driver.find_element_by_class_name(name='user-info').is_displayed():

        time.sleep(1)

    savepic()

    cookies = driver.get_cookies()  # 获取cookie

    print(cookies, type(cookies))

    for cookie in cookies:

        print(cookie)

    jar = RequestsCookieJar()

    for cookie in cookies:

        jar.set(name=cookie.get('name'), value=cookie.get('value'))

    print(jar)

    ua = "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36"

    headers = {'user-agent': ua}

    with requests.get(url=url, headers=headers) as resp:

        print(resp.url)  # 不带cookie会停留在登陆页

    with requests.get(url=url, headers=headers, cookies=jar) as resp:

        print(resp.url)  # 带上cookie会自动登陆跳转到首页

        with open('osc.html', 'wb') as f:

            f.write(resp.content)

参考：

https://selenium-python.readthedocs.io/locating-elements.html

https://selenium-python.readthedocs.io/api.html#module-selenium.webdriver.common.keys

使用selenium模拟登陆oschina的更多相关文章

Selenium模拟登陆百度贴吧
Selenium模拟登陆百度贴吧 from selenium import webdriver from time import sleep from selenium.webdriver.commo ...
selenium 模拟登陆豆瓣，爬取武林外传的短评
selenium 模拟登陆豆瓣,爬去武林外传的短评: 在最开始写爬虫的时候,抓取豆瓣评论,我们从F12里面是可以直接发现接口的,但是最近豆瓣更新,数据是JS异步加载的,所以没有找到合适的方法爬去,于是 ...
使用selenium模拟登陆新浪微博
1.selenium基本使用 1.selenium安装及基本操作 selenium是一个自动化测试工具,它支持各种浏览器,包括Chrome,Safari,Firefox等主流界面浏览器驱动,也包括Ph ...
验证码破解 | Selenium模拟登陆微博
模拟登陆微博相对来说,并不难.验证码是常规的5个随机数字字母的组合,识别起来也比较容易.主要是用到许多Selenium中的知识,如定位标签.输入信息.点击等.如对Selenium的使用并不熟悉,请先移 ...
python selenium模拟登陆163邮箱。
selenium是可以模拟浏览器操作. 有些爬虫是异步加载的,通过爬取网页源码是得不到需要的内容.所以可以模拟浏览器去登陆该网站进行爬取操作. 需要安装selenium通过pip install xx ...
使用selenium模拟登陆淘宝、新浪和知乎
如果直接使用selenium访问淘宝.新浪和知乎这些网址.一般会识别出这是自动化测试工具,会有反制措施.当开启开发者模式后,就可以绕过他们的检测啦.(不行的,哭笑) 如果网站只是对windows.na ...
Python爬虫 —— 知乎之selenium模拟登陆获取cookies+requests.Session()访问+session序列化
代码如下: # coding:utf-8 from selenium import webdriver import requests import sys import time from lxml ...
python selenium模拟登陆qq空间
不多说.直接上代码 from selenium import webdriver driver = webdriver.Chrome() driver.get('http://qzone.qq.com ...
使用python - selenium模拟登陆b站
思路输入用户名密码点击登陆获取验证码的原始图片与有缺口的图片找出两张图片的缺口起始处拖动碎片功能代码段 # 使用到的库 from selenium import webdriver from ...

随机推荐

ABP+AdminLTE+Bootstrap Table权限管理系统第六节--abp控制器扩展及json封装以及6种处理时间格式化的方法
返回总目录:ABP+AdminLTE+Bootstrap Table权限管理系统一期一,控制器AbpController 说完了Swagger ui 我们再来说一下abp对控制器的处理和json的封 ...
GlusterFS分布式存储系统中更换故障Brick的操作记录
前面已经介绍了GlusterFS分布式存储集群环境部署记录,现在模拟下更换故障Brick的操作: 1)GlusterFS集群系统一共有4个节点,集群信息如下: 分别在各个节点上配置hosts.同步好系 ...
Docker管理工具 - Swarm部署记录
之前介绍了Docker集群管理工具-Kubernetes部署记录,下面介绍另一个管理工具Swarm的用法,Swarm是Docker原生的集群管理软件,与Kubernetes比起来比较简单. Swarm ...
VIM编辑器常用命令（转）
转自:https://www.cnblogs.com/Nice-Boy/p/6124177.html
SVN解决冲突
SVN冲突出现场景如今是一个团结协作的时代,开发一个系统,往往会多人协作共同完成.版本管理是必不可少的,常用的软件有Git,SVN等.今天说一下,SVN管理版本时,如果出现冲突后,如何快速解决冲突. ...
Java web错误总结~
1.java程序中没有错,但是项目上面显示一个红叉的解决办法错误信息: 报Description Resource Path Location Type Java compiler level d ...
安装MySQL和其他包
安装 MySQL 1. 下载 MySQL 安装包记得要下载 msi 可执行文件,而不是源码包. https://dev.mysql.com/downloads/file/?id=474803 这个安 ...
Java基础实践一：for关键字的实现原理
Java源码: /** * Demo.java * com.yuanchuangyun.libra.web * * * ver date author * ────────────────────── ...
Docker for windows 入门一（下载安装）
预安装条件,可以查阅官方文档,本人是Win10 x64(必要条件)教育版+开启Hyper-V(Feature特性),具体可参考云栖社区的文章: https://yq.aliyun.com/articl ...
Max length of title attribute in html
测了一下chrome是1024个utf-8字符. 具体可见: http://stackoverflow.com/questions/8516235/max-length-of-title-attrib ...

使用selenium模拟登陆oschina

使用selenium模拟登陆oschina的更多相关文章

随机推荐

热门专题