使用selenium实现站长素材图片采集

from selenium import webdriver

import requests,os

from lxml import etree

from selenium.webdriver.chrome.options import Options

from urllib import request

chrome_options = Options()

chrome_options.add_argument('--headless')

chrome_options.add_argument('--disable-gpu')   #跳过视图界面

pro = webdriver.Chrome(executable_path='./chromedriver.exe',options=chrome_options)

url = "http://sc.chinaz.com/tupian/haiyangshengwutupian.html"

pro.get(url)

js = 'window.scrollTo(0,document.body.scrollHeight)'

pro.execute_script(js)

page_text = pro.page_source

tree = etree.HTML(page_text)

url_img = tree.xpath('//div[@id="container"]/div[@class="box picblock col3 masonry-brick"]/div/a/img/@src')  #获取图片url列表

names = tree.xpath('//div[@id="container"]/div[@class="box picblock col3 masonry-brick"]/div/a/@alt')   #图片名称列表

if not os.path.exists('./img'):  #生成文件夹

    os.mkdir('./img')

for index,url in enumerate(url_img):

    img_path = './img/' + names[index]+'.jpg'  #提取图片名称

    request.urlretrieve(url,img_path)

使用selenium实现站长素材图片采集的更多相关文章

3D图片采集与展示（SurfaceView 自适应 Camera, 录制视频，抽取帧）
最近在做一个3D图片采集与展示. 主要功能为:自定义Camera(google 已经摈弃了Camera, 推荐使用Camera2,后续篇幅,我将会用Camera2取代Camera),围绕一个物体360 ...
C#图片采集软件自动翻页自动分类（收集美图必备工具）（一）
网站管理员希望将别人的整站数据下载到自己的网站里或者将别人网站的一些内容保存到自己的服务器上.从内容中抽取相关的字段,发布到自己的网站系统中.有时需要将网页相关的文件也保存到本地,如图片.附件等. 图 ...
分享一组Rpg Marker人物行走,游戏素材图片，共20张图片
分享一组Rpg Marker人物行走,游戏素材图片,共20张图片上面的下载地址链接是图片,无法直接复制哦!下载请直接点击: 游戏素材下载或者复制以下链接:http://***/view/13.h ...
基于ZedBoard的Webcam设计(一)：USB摄像头(V4L2接口)的图片采集【转】
转自:http://www.cnblogs.com/surpassal/archive/2012/12/19/zed_webcam_lab1.html 一直想把USB摄像头接到Zedboard上,搭建 ...
图片采集器_PHP
现在国内模仿“pinterest”的越来越多了,之前我做过一个基于chrome浏览器上的一个“图片采集工具”,类似于“花瓣网“那样的,初期我觉得挺简单,后来做起来发现还是挺复杂的,特别是整合到你自己的 ...
php图片采集后按原路径保存图片
php图片采集后按原路径保存图片. 代码: <?php $domain ='http://www.jbxue.com'; $url = '/newskin/images/v4/logo.jpg' ...
15、USB摄像头图片采集+QT显示
一.Qt的下载和的安装关于Qt的安装,网络上有很详细的介绍.这里只做简单介绍. 需要的安装包一共有两个:Qt Creator 和QTE. 1)QT Creator 下载地址:qt-sdk-linux ...
Selenium&EmguCV实现爬虫图片识别
概述爬虫需要抓取网站价格,与一般抓取网页区别的是抓取内容是通过AJAX加载,并且价格是通过CSS背景图片显示的. 每一个数字对应一个样式,如'p_h57_5' .p_h57_5 { backgrou ...
selenium爬取百度图片
一:简介通过selenium模块,模拟火狐浏览器进行搜索下载操作. 二:脚本内容 # -*- coding:utf-8 -*- # 百度图片自动爬去 # Chrome浏览器类似,设置其options ...

随机推荐

乐字节Java学习03-path环境变量
1. path环境变量的作用保证javac命令可以在任意目录下运行. 2. path配置的两种方案: 方法一如下: ①点击计算机->右键->属性 ②高级系统设置 ③高级—>环境变 ...
linux下安装lnmp集成环境
linux下安装lnmp集成环境教程地址:https://www.cnblogs.com/peteremperor/p/6750204.html 必须要用root用户,否则权限不够无法安装安装最新 ...
Python之数字的四舍五入（round(value, ndigits) 函数）
round(value, ndigits) 函数 print(round(1.23)) # 1 print(round(1.27)) # 1 print(round(1.23,1)) # 1.2 第二 ...
js — 字符串
目录 1. 拼接字符串 2. 获取字符的方法 3. 字符串操作方法(切片) 4. 字符串位置方法 - 索引 5. trim()方法 6. 字符串大小写转换方法字符串 typeof 用于校验当前变量的 ...
preg_replace
preg_replace — 执行一个正则表达式的搜索和替换说明: preg_replace ( mixed $pattern , mixed $replacement , mixed $subje ...
『Python基础练习题』day01
个人主页: https://lipeiguan.top 1.简述变量命名规范 2.name = input(">>>") name变量是什么数据类型? 3.if条 ...
创客课堂——Scratch的操作界面
大家好,这里是蓝精灵创客公益课堂,我是蓝老师上期我们了解了scratch软件进行了简单的了解,很多朋友都已经按照上期方法下载安装好了软件. 那么今天蓝老师就和大家一起认识下Scratch的操作界面及 ...
烧脑！CMU、北大等合著论文真的找到了神经网络的全局最优解
烧脑!CMU.北大等合著论文真的找到了神经网络的全局最优解机器之心已认证的官方帐号 811 人赞同了该文章选自arXiv,作者:Simon S. Du.Jason D. Lee.Haochu ...
rgba()和opacity的比较（转）
https://blog.csdn.net/u014150409/article/details/44906767
C# DateTime Subtract
DateTime start = DateTime.Now.AddDays(-20); DateTime end = DateTime.Now; TimeSpan ts = end.Subtract( ...

使用selenium实现站长素材图片采集

使用selenium实现站长素材图片采集的更多相关文章

随机推荐

热门专题