selenium 提取天猫网页数据
from time import sleep
from selenium import webdriver br = webdriver.Chrome() url = "https://www.tmall.com"
br.get(url) input = br.find_element_by_id("mq")
input.clear()
input.click()
input.send_keys("iphone")
input.submit() from lxml import etree html = etree.HTML(br.page_source) # 方式一 单独获取所有单标签后,组合 如果某个数据少了,容易错位,不推荐
# prices = html.xpath('//*[@id="J_ItemList"]/div//p[@class="productPrice"]/em/text()')
# titles = html.xpath('//*[@id="J_ItemList"]/div//p[@class="productTitle"]/a/@title')
# shops = html.xpath('//*[@id="J_ItemList"]/div//div[@class="productShop"]/a/text()')
# imgs = html.xpath('//*[@id="J_ItemList"]/div//div[@class="productImg-wrap"]//a/img/@src')
#
# list = list(zip(titles,prices,shops,imgs))
# print(list)
# print(len(list)) products = html.xpath('//div[@id="J_ItemList"]//div[@class="product-iWrap"]') for product in products:
price = product.xpath('./p[@class="productPrice"]/em/@title')
title = product.xpath('./p[@class="productTitle"]/a/@title')
shop = product.xpath('./div[@class="productShop"]/a/text()')
print(price,title,shop)
结果
C:\Users\brady\.conda\envs\python36\python.exe E:/www/djangotest/test_selenium.py
['3499.00'] ['Apple/苹果 iPhone 8'] ['\nApple Store 官方旗舰店\n']
['4999.00'] ['Apple/苹果 iPhone 8 Plus'] ['\nApple Store 官方旗舰店\n']
['5999.00'] ['Apple/苹果 iPhone 11'] ['\nApple Store 官方旗舰店\n']
['5999.00'] ['【12期免息 下单减200元】Apple/苹果 iPhone 11全网通4G 超广角拍照手机苏宁易购官方store苹果11'] ['\n苏宁易购官方旗舰店\n']
['10899.00'] ['【下单立减700元】Apple/苹果 iPhone 11 Pro Max 全网通4G智能手机苏宁易购官方旗舰店苹果11ProMax'] ['\n苏宁易购官方旗舰店\n']
['5999.00'] ['【12期免息 下单减200】Apple/苹果 iPhone 11 移动联通电信4G全网通智能手机正品苏宁易购官方旗舰店苹果11'] ['\n苏宁易购官方旗舰店\n']
['9999.00'] ['【12期0息 再减500元】Apple/苹果 iPhone 11 Pro全网通4G智能手机 苏宁易购官方旗舰店 苏宁直发 苹果11pro'] ['\n苏宁易购官方旗舰店\n']
['10899.00'] ['【12期0息 再减700元】Apple/苹果 iPhone 11 Pro Max 全网通4G智能手机 苏宁易购官方旗舰店苹果11Promax'] ['\n苏宁易购官方旗舰店\n']
['9999.00'] ['【下单立减500元】Apple/苹果 iPhone 11 Pro移动联通电信4G全网通手机苏宁易购官方旗舰店苹果11pro'] ['\n苏宁易购官方旗舰店\n']
['10899.00'] ['Apple/苹果 iPhone 11 Pro Max'] ['\nApple Store 官方旗舰店\n']
['5088.00'] ['【下单最高减289元】Apple/苹果 iPhone XR全网通4G 双卡双待手机苏宁易购官方旗舰店 苹果iPhoneXR'] ['\n苏宁易购官方旗舰店\n']
['4388.00'] ['【下单立减189元】Apple/苹果 iPhone 8 Plus 64G 全网通4G手机 官方正品苹果iPhone8plus 苹果8p'] ['\n苏宁易购官方旗舰店\n']
['5999.00'] ['【限时享12期免息/现货速发】苹果11 Apple/iPhone 11苹果手机2019新款全网通智能手机正品xr xsmax 7plu'] ['\n中国移动手机官方旗舰店\n']
['5299.00'] ['Apple/苹果 iPhone XR'] ['\nApple Store 官方旗舰店\n']
['4449.00'] ['【限时享12期免息】Apple/苹果 iPhone 8 Plus 全网通4G智能手机iphone8plus 苹果8p 苏宁易购官方旗舰店'] ['\n苏宁易购官方旗舰店\n']
['5888.00'] ['当天发货/24期分期Apple 苹果 iPhone 11全网通苹果11正品手机X国行官方xr官网8Plus旗舰店xsmax新品11promax'] ['\n三际数码官方旗舰店\n']
['5358.00'] ['【购机送无线充电器】苹果11 中移动Apple/iPhone 11苹果手机2019新款全网通智能手机苹果xr xsmax 7plus正品'] ['\n中国移动官方旗舰店\n']
['5299.00'] ['【限时享12期免息】Apple/苹果 iPhone XR 64G/128G 全网通4G智能手机双卡双待iphonexr 苹果XR'] ['\n苏宁易购官方旗舰店\n']
['6888.00'] ['5888元起 24期分期现货苹果xsmax Apple/苹果 iPhone XS Max 官网官方旗舰店全网通11pro手机X苹果8P xr xs 7'] ['\n三际数码官方旗舰店\n']
['9999.00'] ['Apple/苹果 iPhone 11 Pro'] ['\nApple Store 官方旗舰店\n']
['5349.00'] ['【顺丰发货 下单送壳膜套装】Apple/苹果iPhone 11全网通4G手机8PXs苹果11新x官方旗舰店iPhone11 pro国行max'] ['\n翼天下天翼电信旗舰店\n']
['10358.00'] ['现货送无线充/24期分期Apple苹果iPhone 11 Pro MAX全网通官xsmax网旗舰店国行11promax新正品8P苹果11手机X'] ['\n三际数码官方旗舰店\n']
['5930.00'] ['Apple 苹果 iPhone 11(A2223) 全网通苹果11苹果手机双卡官方旗舰店 花呗 苹果xr xsmax 8plus'] ['\n四川移动官方旗舰店\n']
['10899.00'] ['【12期免息】Apple/苹果 iPhone 11 Pro MAX 2019新品 全网通手机 苹果11promax 拍照智能手机'] ['\n绿森数码官方旗舰店\n']
['5349.00'] ['【顺丰发货 下单送壳膜套装】Apple/苹果 iPhone 11全网通4G手机 苹果11新x天翼电信官方旗舰店官网国行XS 8p'] ['\n翼天下天翼电信旗舰店\n']
['10358.00'] ['【购机送无线充电器】Apple/苹果 iPhone 11 Pro Max苹果手机中移动新款全网通手机苹果xr xsmax 8plus'] ['\n中国移动官方旗舰店\n']
['9628.00'] ['【购机送无线充电器】苹果11 Pro Apple/苹果 iPhone 11Pro苹果手机中移动2019新款全网通苹果xr xsmax 8plus'] ['\n中国移动官方旗舰店\n']
['5358.00'] ['【购机送无线充电器】 苹果11 Apple/iPhone 11苹果手机中移动2019新款全网通智能手机苹果xr xsmax 7plus'] ['\n中国移动官方旗舰店\n']
['5999.00'] ['【中国移动 正品保障】苹果xs max Apple/苹果 iPhone XS Max手机中移动iPhone xs 11Pro Max xr 7plus手机'] ['\n中国移动官方旗舰店\n']
['5888.00'] ['当天发【24期分期/送无线充】Apple/苹果 iPhone 11 手机现货4G全网通新款iphone11 pro max国行正品保证xs'] ['\n博盛景数码专营店\n']
['5398.00'] ['【中国移动 正品保障】苹果xs Apple/苹果 iPhone XS手机全网通中移动iPhone XS Max 11Pro max xr 7plus手机'] ['\n中国移动官方旗舰店\n']
['5358.00'] ['【购机送无线充+咨询再享4选1】苹果11Apple/iPhone 11苹果手机2019新款全网通智能手机苹果xr xsmax 8plus'] ['\n君问数码官方旗舰店\n']
['4998.00'] ['24期分期/现货速发/iphone/Apple/苹果 iPhone XR 4G全网通手机官方旗舰店国行正品xr苹果11降价x xs11proMax'] ['\n三际数码官方旗舰店\n']
['5958.00'] ['【当天发 选送蓝牙耳机】Apple/苹果 iPhone 11全网通iphone11手机官网旗舰店正品xr官方pro国行8plus学生机'] ['\n轻松换数码旗舰店\n']
['6499.00'] ['蜜茶手机苹果xs iphone xs Apple/苹果 iphonexs 苹果手机xs 苹果xs手机 国行正品全网通苹果手机'] ['\n搜酷数码专营店\n']
['6968.00'] ['3期免息现货Apple苹果iPhoneXSMax6.5英寸双卡双待全网通移动电信联通4G智能手机64/256GB全新原封装国行正品'] ['\n岗隆数码专营店\n']
['6688.00'] ['【当天发货/24期分期】Apple/苹果iPhone 11官方旗舰店国行苹果11全网通4G手机x官方xr 8plus新品11pro xsmax'] ['\n能良数码官方旗舰店\n']
['5999.00'] ['【限时享12期免息】苹果11 Apple/iPhone 11苹果手机2019新款全网通手机苹果正品xr xsmax 7plus'] ['\n中国移动手机官方旗舰店\n']
['4598.00'] ['【中国移动 正品保障】苹果xr中移动Apple/苹果 iPhone XR全网通手机iphone 11 Pro max xr 7plus苹果xr正品'] ['\n中国移动官方旗舰店\n']
['9699.00'] ['【顺丰送壳膜套装 晒单送无线充】Apple苹果iPhone 11 Pro全网通智能4G手机电信官方旗舰店官网新x苹果11pro'] ['\n翼天下天翼电信旗舰店\n']
['6058.00'] ['【现货当天发/6期免息】Apple 苹果 iPhone 11 全网通4G手机8plus官方XR旗舰店11pro正品苹果iPhone11max'] ['\n能良数码官方旗舰店\n']
['7149.00'] ['【顺丰速发】Apple/苹果 iPhone XS Max 全网通版 苹果xsmax xr xs苹果11正品官方旗舰店Pro max'] ['\n中国移动手机官方旗舰店\n']
['5888.00'] ['【12期分期0首付 全国联保】Apple/苹果iPhone11官方旗舰店国行全网通4G手机官方xr xsmax 8plus'] ['\n高远数码旗舰店\n']
['5828.00'] ['【顺丰包邮】Apple/苹果iPhone 11#移动联通电信全网通4G智能手机 中国电信官方旗舰店'] ['\n中国电信官方旗舰店\n']
['5799.00'] ['蜜茶手机 Apple/苹果 iPhone 11 移动联通电信全网通4G智能全面屏手机 官方正品 全国联保iphone11 苹果11'] ['\n虫马虫义数码专营店\n']
['4319.00'] ['【12期分期】苹果8plus Apple/苹果 iPhone 8Plus手机中移动全网通iPhone xr 7plus xsmax 11Pro max正品手机'] ['\n中国移动官方旗舰店\n']
['6999.00'] ['蜜茶手机苹果xs max 12期分期 Apple/苹果 iPhone XS Max手机 苹果XSmax4G 全网通iphonexsmax max xsmax'] ['\n搜酷数码专营店\n']
['5398.00'] ['蜜茶手机 iPhone xr 全网通4G手机双卡双待 全新正品国行XR苹果手机 iphone xr 苹果iphonexr 苹果xr'] ['\n虫马虫义数码专营店\n']
['11188.00'] ['【12期免息】Apple/苹果iPhone 11 Pro Max 手机苹果11新品iphone11promax国行正品iphone13/iPhone xs max'] ['\n博盛景数码专营店\n']
['4999.00'] ['蜜茶手机Apple/苹果 iPhone XR 全网通4G手机双卡双待 全新国行 iPhonexr 手机 iphonexr 苹果xr iphone xr'] ['\n搜酷数码专营店\n']
['3849.00'] ['【中国移动 正品保障】苹果8Apple/苹果 iPhone 8手机全网通中移动iPhone xsmax 11Pro max xr 8plus手机正品'] ['\n中国移动官方旗舰店\n']
['3598.00'] ['【顺丰包邮+送壳膜套装】苹果7plus Apple/苹果iPhone 7Plus手机全网通中移动苹果手机iPhone 8plus xr xsmax'] ['\n中国移动官方旗舰店\n']
['3459.00'] ['【稀缺货源 限量抢购】Apple/苹果 iPhone 7 Plus 32G 全网通4G手机iPhone7plus'] ['\n苏宁易购官方旗舰店\n']
['5288.00'] ['5288元起/24期分期/苹果xs Apple/苹果 iPhone XS 4G全网通官方官网旗舰店正品11手机11pro苹果X 8p xsmax xr'] ['\n三际数码官方旗舰店\n']
['10388.00'] ['当天发货【24期分期/送无线充】Apple/苹果iPhone 11 Pro Max 手机苹果11新品iphone11promax国行正品13/xs'] ['\n博盛景数码专营店\n']
['3588.00'] ['12期分期/现货速发/苹果7plus Apple/苹果 iPhone 7 Plus 全网通官网官方旗舰店4G手机苹果11 6P 8 p xr x 7P'] ['\n三际数码官方旗舰店\n']
['10298.00'] ['【当天发货/24期分期】Apple/苹果iPhone 11 ProMAX 官网旗舰店全网通国行iPhone11手机xsmax苹果8plus 11pro'] ['\n能良数码官方旗舰店\n']
['5798.00'] ['24期分期Apple 苹果 iPhone 11 全网通智能4G苹果11正品手机xs官方官网旗舰店X新品11promax xr'] ['\n同迅数码专营店\n']
['9588.00'] ['24期分期/现货发/Apple苹果iPhone 11Pro全网通官网官方旗舰店7P国行xr正品8P手机xs苹果X降价新款苹果11max'] ['\n三际数码官方旗舰店\n']
['4299.00'] ['蜜茶手机Apple/苹果 iPhone 8 Plus 全新官方正品国行 全网通 原装 iphone8 plus 苹果8plus 苹果8P'] ['\n搜酷数码专营店\n'] Process finished with exit code 0
selenium 提取天猫网页数据的更多相关文章
- selenium跳过webdriver检测并爬取天猫商品数据
目录 简介 编写思路 使用教程 演示图片 源代码 @(文章目录) 简介 现在爬取淘宝,天猫商品数据都是需要首先进行登录的.上一节我们已经完成了模拟登录淘宝的步骤,所以在此不详细讲如何模拟登录淘宝.把关 ...
- 爬虫---selenium动态网页数据抓取
动态网页数据抓取 什么是AJAX: AJAX(Asynchronouse JavaScript And XML)异步JavaScript和XML.过在后台与服务器进行少量数据交换,Ajax 可以使网页 ...
- 实验楼的php比赛题,网页数据提取。
实验楼的php比赛题,网页数据提取. 题目的地址:https://www.shiyanlou.com/contests/lou5/challenges 以下代码是题目的答案 <?php head ...
- selenium抓取动态网页数据
1.selenium抓取动态网页数据基础介绍 1.1 什么是AJAX AJAX(Asynchronouse JavaScript And XML:异步JavaScript和XML)通过在后台与服务器进 ...
- python爬虫-提取网页数据的三种武器
常用的提取网页数据的工具有三种xpath.css选择器.正则表达式 1.xpath 1.1在python中使用xpath必须要下载lxml模块: lxml官方文档 :https://lxml.de/i ...
- API例子:用Python驱动Firefox采集网页数据
1,引言 本文讲解怎样用Python驱动Firefox浏览器写一个简易的网页数据采集器.开源Python即时网络爬虫项目将与Scrapy(基于twisted的异步网络框架)集成,所以本例将使用Scra ...
- 使用webdriver+urllib爬取网页数据(模拟登陆,过验证码)
urilib是python的标准库,当我们使用Python爬取网页数据时,往往用的是urllib模块,通过调用urllib模块的urlopen(url)方法返回网页对象,并使用read()方法获得ur ...
- 怎么用Python写爬虫抓取网页数据
机器学习首先面临的一个问题就是准备数据,数据的来源大概有这么几种:公司积累数据,购买,交换,政府机构及企业公开的数据,通过爬虫从网上抓取.本篇介绍怎么写一个爬虫从网上抓取公开的数据. 很多语言都可以写 ...
- Python爬虫学习教程:天猫商品数据爬虫
天猫商品数据爬虫使用教程 下载chrome浏览器 查看chrome浏览器的版本号,下载对应版本号的chromedriver驱动 pip安装下列包 pip install selenium pip in ...
随机推荐
- pytest测试框架 -- setup和teardown等
一.用例运行级别 1.函数级别(setup.teardown 或 setup_function.teardown_function): 仅对处于同作用域的测试函数有效(该函数定义不在类中,则对非类中测 ...
- hystrix文档翻译之插件
插件 可以通过实现插件来改变Hystrix的行为.可以通过HystrixPlugins来注册自定义插件,这些插件会被应用到HystrixCommand,HystrixObservableCommand ...
- .NET Core加解密实战系列之——使用BouncyCastle制作p12(.pfx)数字证书
简介 加解密现状,编写此系列文章的背景: 需要考虑系统环境兼容性问题(Linux.Windows) 语言互通问题(如C#.Java等)(加解密本质上没有语言之分,所以原则上不存在互通性问题) 网上资料 ...
- Java Web学习(八)RESTful设计
一.RESTful设计风格 REST :指的是一组架构约束条件和原则. RESTful :满足这些约束条件和原则的应用程序或设计就是 . REST 原则 客户端和服务器之间的交互在请求之间是无状态的. ...
- 趣图:我说自己菜 vs 大佬说自己菜
扩展阅读 一大波趣图:CSS的力量 趣图:嫁人就嫁程序员,大妈都懂的! 趣图:向客户介绍的产品VS实际开发的产品 如何准备校招技术面试+一只小菜鸟的面试之路 向Spring大佬低头--大量源码流出 ...
- Spring系列之aAOP AOP是什么?+xml方式实现aop+注解方式实现aop
Spring系列之aop aop是什么?+xml方式实现aop+注解方式实现aop 什么是AOP? AOP为Aspect Oriented Programming 的缩写,意识为面向切面的编程,是通过 ...
- Appium 用途和特点
Appium 是一个移动 App (手机应用)自动化工具. 手机APP 自动化有什么用? 自动化完成一些重复性的任务 比如微信客服机器人 爬虫 就是通过手机自动化爬取信息. 为什么不通过网页.HTTP ...
- Pycharm默认输入状态是insert状态,选中文字无法直接输入替换或删除
最近在学习Python,使用pycharm的时候,我的光标处于加粗状态,也就是编程软件经常出现的insert插入编辑模式,我就点击了一下insert按键,退出了这个模式,但是我每次打开都是会处于这种模 ...
- spring Boot面试题(2020最新版)
概述 什么是 Spring Boot? Spring Boot 是 Spring 开源组织下的子项目,是 Spring 组件一站式解决方案,主要是简化了使用 Spring 的难度,简省了繁重的配置,提 ...
- Oracle12c 使用总结
/*创建临时表空间 */create temporary tablespace BBB tempfile 'D:\APP\oracle\oradata\orcl\BBB.dbf' size 500m ...