淘宝模拟登陆实现

由于淘宝使用了滑动验证码,需要进行模糊手动滑动,因此考虑使用selenium+chromedriver进行模拟登陆。

淘宝的登陆网址:https://login.taobao.com/member/login.jhtml

项目运行准备:

安装python3开发环境,官网自行下载,博主版本为3.7

安装chrome游览器,下载地址:https://www.google.cn/chrome/

安装selenium模块,在终端中输入pip3 install selenium

安装chromedriver驱动,下载地址:http://npm.taobao.org/mirrors/chromedriver/

注意:

  • 在下载chromedriver驱动的时候,需要与chrome游览器的版本尽量保持一致,查看chrome游览器版本方法,在谷歌游览器访问:chrome://settings/help这个网址

项目需要使用的所有模块

import time
from selenium import webdriver
from selenium.webdriver import ActionChains
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

初始化selenium并加载chromedriver驱动

class TB(object):
def __init__(self, *args, **kwargs):
"""
初始化游览器版本
"""
option = webdriver.ChromeOptions()
self.webdriver_obj = webdriver.Chrome(executable_path='chromedriver.exe', chrome_options=option)
# 跳过阿里滑动验证码对selenium的校验
self.webdriver_obj.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
"source": '''
Object.defineProperty(navigator, 'webdriver', {
get: () => undefined
})
'''
})

封装隐式等待进行xpath定位

由于selenium隐式等待进行xpath定位找不到会报错,项目中多次使用这一段代码,因此对这一部分代码进行封装,封装之后的代码如下:

def xpath(self, xpath_bas):
try:
element = WebDriverWait(self.webdriver_obj, 10).until(
EC.presence_of_element_located((By.XPATH, xpath_bas))
)
except:
element = []
finally:
return element

进行登录标签的定位,输入账号,密码操作

    def login(self,username='', password=''):
url = 'https://login.taobao.com/member/login.jhtml'
self.webdriver_obj.get(url)
self.xpath('//*[@id="fm-login-id"]').send_keys(username) # 定位账号输入框,并输入账号
self.xpath('//*[@id="fm-login-password"]').send_keys(password) # 定位密码输入框,并输入密码
self.xpath('//*[@id="login-form"]/div[4]/button').click() # 第一次点击登录按钮
time.sleep(5)
check_yzm_span = self.xpath('//*[@id="nc_1_n1z"]') # 延时定位滑动验证码标签,避免点击登录按钮之后,出现滑动验证码,不需要验证的情况
if bool(check_yzm_span):
print('登录发现滑动验证码')
self.check_yzm(check_yzm_span) # 处理滑动验证码
else:
print('登录未发现滑动验证码')
try:
frame = self.xpath('//*[@id="content"]/div/div[1]/iframe') # 定位iframe标签,由于iframe没有id,name这种唯一的属性,因此只能通过先定位,在切换实现
self.webdriver_obj.switch_to.frame(frame) # 由于手机验证页面出现了页面的嵌套,因此需要进行页面跳转到iframe下
check_phone_button = self.xpath('//*[@id="J_GetCode"]')
print('登录发现手机验证码')
self.check_phone_yzm(check_phone_button) # 处理手机登录验证码
except:
print('登录未发现手机验证码')
finally:
print('登陆成功')

处理滑动验证码

定位到滑块的标签



定位滑动槽的标签



通过定位发现滑动槽的长度是300,滑块的长度是40,因此需要滑动的距离大约是260.

因此可以通过ActionChains动作链实现对滑动的拖动操作,具体代码如下:

    def check_yzm(self, check_yzm_span):
"""
处理滑动验证码,没有测试
:param check_yzm_span:
:return:
"""
# 实例化一个动作链关联游览器
action = ActionChains(self.webdriver_obj)
# 使用鼠标动作链进行点击并悬浮
action.click_and_hold(check_yzm_span)
# 滑动验证码
action.move_by_offset(xoffset=258, yoffset=0).perform()
time.sleep(1)
# 再次点击登录按钮
self.xpath('//*[@id="login-form"]/div[4]/button').click()

处理手机验证码

在点击登录之后,淘宝会进行身份验证,就是让你输入手机验证码,然后对验证码进行输入后,才能让你登录成功。



发现,淘宝这个页面出现了页面的嵌套,并且iframe没有id,name这样唯一的属性值,因此只能通过先对iframe标签进行定位,然后通过switch_to进行页面的切换。

切换页面之后,剩下的思路就是点击获取验证码按钮,输入验证码,点击确认按钮。具体实现代码如下:

    def check_phone_yzm(self, check_phone_button):
check_phone_button.click()
yzm = input('请输入手机验证码:')
self.xpath('//*[@id="J_Phone_Checkcode"]').send_keys(yzm)
self.xpath('//*[@id="submitBtn"]').click()

最后登陆成功之后的截图如下:

selenium模拟淘宝登陆,过所有验证的更多相关文章

  1. 【Python】selenium模拟淘宝登录

    # -*- coding: utf-8 -*- from selenium import webdriver from selenium.webdriver.common.by import By f ...

  2. 使用selenium实现模拟淘宝登陆

    from selenium import webdriverfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.w ...

  3. php单点登录之模拟淘宝天猫同步登录

    说到单点登录大家都很了解,一个站点登录其他域会自动登录. 单点登录SSO(Single Sign On)的方法有很多,比如:p3p.共享session.共享cookice.第三方OAuth认证. 这里 ...

  4. selenium实现淘宝的商品爬取

    一.问题 本次利用selenium自动化测试,完成对淘宝的爬取,这样可以避免一些反爬的措施,也是一种爬虫常用的手段.本次实战的难点: 1.如何利用selenium绕过淘宝的登录界面 2.获取淘宝的页面 ...

  5. 模拟淘宝登录和购物车功能:使用cookie记录登录名,下次登录时能够记得上次的登录名,使用cookie模拟购物车功能,使用session记住登录信息并验证是否登录,防止利用url打开网站,并实现退出登录功能

    Login <%@ page language="java" contentType="text/html; charset=UTF-8" pageEnc ...

  6. 【Python】使用Selenium实现淘宝抢单

    最近,小明为了达成小姐姐的愿望,在某宝买到心仪的宝贝,再加上又迷上了python,就通过python轻而易举地实现了(个人声明:对Java来说,这并不是背叛). 需求分析&前期准备 需求其实很 ...

  7. 九、Python+Selenium模拟用QQ登陆腾讯课堂,并提取报名课程(练习)

    研究QQ登录规则的话,得分析大量Javascript的加密解密,比较耗时间.自己也是练习很少,短时间成功不了.所以走了个捷径. Selenium是一个WEB自动化测试工具,它运行时会直接实例化出一个浏 ...

  8. 爬虫实战【8】Selenium解析淘宝宝贝-获取多个页面

    作为全民购物网站的淘宝是在学习爬虫过程中不可避免要打交道的一个网站,而是淘宝上的数据真的很多,只要我们指定关键字,将会出现成千上万条数据. 今天我们来讲一下如何从淘宝上获取某一类宝贝的信息,比如今天我 ...

  9. 模拟淘宝购物,运用cookie,记录登录账号信息,并且记住购物车内所选的商品

    1.登录界面 <%@ page language="java" contentType="text/html; charset=UTF-8" pageEn ...

随机推荐

  1. “3+3”看华为云FusionInsight如何引领“数据新基建”持续发展

    摘要:一个统一的现代化的数据基建需要三类架构来实践三种不同的应用场景. 近期,美国知名科技企业风投机构A16Z总结出一套通用的技术架构服务,分为以下三种场景. 一.数据基建架构全景 数据流向显示,左侧 ...

  2. 【JVM第三篇--运行时数据区】程序计数器、虚拟机栈、本地方法栈

    写在前面的话:本文是在观看尚硅谷JVM教程后,整理的学习笔记.其观看地址如下:尚硅谷2020最新版宋红康JVM教程 一.运行时数据区 我们在编写Java程序时,使用JVM的流程主要如下所示: 虚拟机在 ...

  3. LOJ #2005. 「SDOI2017」相关分析 线段树维护回归直线方程

    题目描述 \(Frank\) 对天文学非常感兴趣,他经常用望远镜看星星,同时记录下它们的信息,比如亮度.颜色等等,进而估算出星星的距离,半径等等. \(Frank\) 不仅喜欢观测,还喜欢分析观测到的 ...

  4. 重构克隆rbd的数据

    前言 之前写过一篇重构rbd的元数据的文章,讲的是如果rbd的元数据丢失了,数据还在的时候怎么恢复相关的元数据,但是实际使用的场景是,集群可能崩溃了,数据还在,osd无法拉起来,数据又很重要,需要把数 ...

  5. Angualr 内置工具-SelectionModel

    SelectionModel: 被用来控制选中一个和多个item时候的逻辑.例如下拉菜单,复选框选中等,非常方便. 引入:import{SelectionModel}from'@angular/cdk ...

  6. async await 你真的用对了吗?

    大部分同学了解Promise,也知道async await可以实现同步化写法,但实际上对一些细节没有理解到位,就容易导致实际项目中遇到问题. 开始先抛结论,下文将针对主要问题点进行论述. 1.所有as ...

  7. 虚拟机、ip地址

    使用的系统 虚拟机:VMware workstations+win10:注:系统装好后先切换成Administrator,给VMware装VMware Tools linux发行版本  rhel-se ...

  8. LeetCode 中等题解(3)

    34 在排序数组中查找元素的第一个和最后一个位置 Question 给定一个按照升序排列的整数数组 nums,和一个目标值 target.找出给定目标值在数组中的开始位置和结束位置. 你的算法时间复杂 ...

  9. kali 系列学习08-安卓逆向

    可以轻松把安卓apk的源码逆向出来,逆向有什么用,比如手机apk木马,可以用于追踪黑客,详见  https://cloud.tencent.com/developer/news/179336 用2个工 ...

  10. 用思维导图软件MindManager整理假期

    今天带大家使用MindManager2020软件构建出2020年的节假日思维导图. 既然是做2020年的节假日思维导图,那么有个MindManager技巧就是,关于这一类思维导图我们都可以选择时间线导 ...