爬虫之selenium爬取京东商品信息

import json

import time

from selenium import webdriver

"""

发送请求

    1.1生成driver对象

    2.1窗口最大化

    2.2下拉滚动条（保证每个位置都刷新）

    3.获取所有li标签列表

    遍历li标签列表提取图片的连接以及主播的名字

    保存图片

翻页

"""

driver = webdriver.Chrome()

driver.maximize_window()

time.sleep(1)

# 京东商品页

driver.get('https://list.jd.com/list.html?cat=9987,653,655&ev=exbrand%5F12669&sort=sort_rank_asc&trans=1&JL=3_%E5%93%81%E7%89%8C_%E9%AD%85%E6%97%8F%EF%BC%88MEIZU%EF%BC%89#J_crumbsBar')

while True:

    time.sleep(1)

    for i in range(16):

        driver.execute_script('window.scrollTo(0,{})'.format(i * 500))

        time.sleep(1)

    lis = driver.find_elements_by_xpath('//ul[@class="gl-warp clearfix"]/li')

    with open('京东.txt', 'w', encoding='utf-8') as f:

        for li in lis:

            # 商品图片、价格、评价人数、商品名

            img_url = li.find_element_by_xpath('./div/div[1]/a/img').get_attribute('src')

            price = li.find_element_by_xpath('.//strong[@class="J_price"]').text

            buyers = li.find_element_by_xpath('./div/div[5]/strong').text

            name = li.find_element_by_xpath('./div/div[4]//em').text

            # 将信息写入文本

            dic = {}

            dic['name'] = name

            dic['price'] = price

            dic['buyers'] = buyers

            json.dump(dic, f, ensure_ascii=False)

            f.write(',\n')

    try:

        next_url = driver.find_element_by_xpath('//a[@class="pn-next"]').click()

    except Exception as e:

        print(e)

        break

time.sleep(1)

driver.close()

爬虫之selenium爬取京东商品信息的更多相关文章

python爬虫——用selenium爬取京东商品信息
1.先附上效果图(我偷懒只爬了4页) 2.京东的网址https://www.jd.com/ 3.我这里是不加载图片,加快爬取速度,也可以用Headless无弹窗模式 options = webdri ...
selenium模块使用详解、打码平台使用、xpath使用、使用selenium爬取京东商品信息、scrapy框架介绍与安装
今日内容概要 selenium的使用打码平台使用 xpath使用爬取京东商品信息 scrapy 介绍和安装内容详细 1.selenium模块的使用 # 之前咱们学requests,可以发送htt ...
利用selenium爬取京东商品信息存放到mongodb
利用selenium爬取京东商城的商品信息思路: 1.首先进入京东的搜索页面,分析搜索页面信息可以得到路由结构 2.根据页面信息可以看到京东在搜索页面使用了懒加载,所以为了解决这个问题,使用递归.等待 ...
爬虫系列(十三) 用selenium爬取京东商品
这篇文章,我们将通过 selenium 模拟用户使用浏览器的行为,爬取京东商品信息,还是先放上最终的效果图: 1.网页分析 (1)初步分析原本博主打算写一个能够爬取所有商品信息的爬虫,可是在分析过程 ...
selenium+phantomjs爬取京东商品信息
selenium+phantomjs爬取京东商品信息今天自己实战写了个爬取京东商品信息,和上一篇的思路一样,附上链接:https://www.cnblogs.com/cany/p/10897618. ...
爬虫—Selenium爬取JD商品信息
一,抓取分析本次目标是爬取京东商品信息,包括商品的图片,名称,价格,评价人数,店铺名称.抓取入口就是京东的搜索页面,这个链接可以通过直接构造参数访问https://search.jd.com/Sea ...
Python爬虫-爬取京东商品信息-按给定关键词
目的:按给定关键词爬取京东商品信息,并保存至mongodb. 字段:title.url.store.store_url.item_id.price.comments_count.comments 工具 ...
Scrapy实战篇（七）之Scrapy配合Selenium爬取京东商城信息（下）
之前我们使用了selenium加Firefox作为下载中间件来实现爬取京东的商品信息.但是在大规模的爬取的时候,Firefox消耗资源比较多,因此我们希望换一种资源消耗更小的方法来爬取相关的信息. 下 ...
八个commit让你学会爬取京东商品信息
我发现现在不用标题党的套路还真不好吸引人,最近在做相关的事情,从而稍微总结出了一些文字.我一贯的想法吧,虽然才疏学浅,但是还是希望能帮助需要的人.博客园实在不适合这种章回体的文章.这里,我贴出正文的前 ...

随机推荐

Mac OS Catalina 如何删除自带的应用
在新推送的系统升级过后,(博主系统是Mac OS Mojave 10.14)我们会发现,之前我们删除的令人讨厌的Mac自带应用又回来了,如果我们还按照之前百度的方式删除的话,参考: https://w ...
js常用Matn函数的操练
Math.PI console.log(Math.PI); 随机数以及向下取整这是一个能实现从a-b之间随机打印一个整数 function rand_s(a, b) { var x = a + (b ...
[LeetCode] 704. Binary Search
Description Given a sorted (in ascending order) integer array nums of n elements and a target value, ...
poll(2) 源码分析
poll(2) poll(2) 系统调用的功能和 select(2) 类似:等待一个文件集合中的文件描述符就绪进行I/O操作. 使用实现 select(2) 的局限性: 关注的文件描述符集合大小最大 ...
MySql权限丢失问题解决
参考文章 [mysql] root权限丢失恢复完全菜鸟教程今天用root账户登录到mysql后, show databases 命令返回的只有两个表, 然后使用 use database 命令提示 ...
致所有.Net者和有梦想的朋友们 - 共勉
这篇文章很早就想写的了,主要是人到了一定的年纪,就想唠叨一些看法,认不认可不重要,重要的是生活给予你的酸甜苦辣,你都想一吐为快. 这里主要基于多年来自己的一个行业感受和以及生活感想,唠叨一下工作以及生 ...
How to Get What You Want 如何得到你想要的
[1]If you want something, give it away. [2]When a farmer wants more seeds, he takes his seeds and gi ...
Io流的概述
Io流的概述IO: I输入(Input),O 输出(Output)1.什么是IO流? 数据流,IO是严格的“水流模型” 所以IO流是用来读写数据,或者传输数据. 注意:File只能操作文件对象本身,而 ...
[ERROR ImagePull]: failed to pull image [k8s.gcr.io/kube-apiserver-amd64:v1.11.1]: exit status 1
问题描述 [root@localhost ~]# kubeadm init --kubernetes-version=v1.11.1 --pod-network-cidr=10.244.0.0/16 ...
线段树区间取max区间查询
要线段树资瓷区间max和询问区间和. 设要把$[L, R]$对mx取max. 我们可以在线段树上二分出小于mx的区间然后变成区间修改了. 具体实现是,维护区间最小值和区间最大值,我们递归进入一个区间, ...

爬虫之selenium爬取京东商品信息

爬虫之selenium爬取京东商品信息的更多相关文章

随机推荐

热门专题