Python-爬虫之股转系统下载文件自动翻页

上次代码只能抓取一个网页上的链接，本次可以自主设定抓取的页面个数。

代码如下：

from selenium import webdriver

import os, time

class DownloadFiles():

    def __init__(self):

        self.url = 'http://www.neeq.com.cn/disclosure/announcement.html'

        self.basePath = os.path.dirname(__file__)

        self.times = 7  #表示翻页的次数

    def makedir(self, name):

        path = os.path.join(self.basePath, name)

        isExist = os.path.exists(path)

        if not isExist:

            os.makedirs(path)

            print('File has been created.')

        else:

            print('The file is existed.')

        # 切换到该目录下

        os.chdir(path)

    def connect(self, url):

        driver = webdriver.PhantomJS()

        driver.get(url)

        return driver

    #翻页

    def nextPage(self, driver):

        #每次点击next之后停顿5秒钟

        next = driver.find_element_by_class_name('next')

        next.click()

        time.sleep(5)

    def getFiles(self):

        driver = self.connect(self.url)

        self.makedir('Files')

        #自动翻页

        for i in range(self.times):

            print('第' + str(i+1) + '页:')

            aList = driver.find_elements_by_tag_name('a')

            for r in aList:

                try:

                    link = r.get_attribute('href')

                    if link.endswith('pdf'):

                        print(r.text)

                        print(link)

                        fileName = r.text + '.pdf'

                        #urlretrieve(link, fileName)

                except:

                    pass

            self.nextPage(driver=driver)

if __name__ == '__main__':

    obj = DownloadFiles()

    obj.getFiles()

Python-爬虫之股转系统下载文件自动翻页的更多相关文章

【图文详解】python爬虫实战——5分钟做个图片自动下载器
python爬虫实战——图片自动下载器之前介绍了那么多基本知识[Python爬虫]入门知识,(没看的先去看!!)大家也估计手痒了.想要实际做个小东西来看看,毕竟: talk is cheap sho ...
使用FileZilla从Linux系统下载文件
需求:将Linux系统的的某个文件夹(里面包含文件夹和文件)下载到我Windows系统某个文件夹里之前我使用xshell下载,但是通过 rz :上传sz:下载命令中的sz命令,下载失败. 下载 c ...
python webdriver api-右键另存下载文件
右键另存下载文件先编辑SciTE脚本: ;ControlFocus("title","text",controlID) ;表示将焦点切换到标题为title窗体 ...
python爬虫实战——5分钟做个图片自动下载器
python爬虫实战——图片自动下载器制作爬虫的基本步骤顺便通过这个小例子,可以掌握一些有关制作爬虫的基本的步骤. 一般来说,制作一个爬虫需要分以下几个步骤: 分析需求(对,需求分析非常重要, ...
初级版python登录验证，上传下载文件加MD5文件校验
服务器端程序 import socket import json import struct import hashlib import os def md5_code(usr, pwd): ret ...
python网络编程-socket上传下载文件(包括md5验证，大数据发送，粘包处理)
ftp server 1) 读取文件名 2)检查文件是否存在 3)打开文件 4)检查文件大小 5)发送文件大小给客户端 6)等客户端确认 7)开始边读边(md5计算)发数据 8)给客户端发md5 ft ...
使用Python在自己博客上进行自动翻页
先上一张代码及代码运行后的输出结果的图! 下面上代码: # coding=utf-8 import os import time from selenium import webdriver #打开火 ...
Python 爬虫实例（13）下载 m3u8 格式视频
Python requests 下载 m3u8 格式视频最近爬取一个视频网站,遇到 m3u8 格式的视频需要下载. 抓包分析,视频文件是多个 ts 文件,什么是 ts文件,请去百度 ...
Python爬虫之记录一次下载验证码的尝试
好久没有写过爬虫的文章了,今天在尝试着做验证码相关的研究时,遇到了验证码的收集问题. 一般,验证码的加载都有着比较复杂的算法和加密在里边,但是笔者今天碰到的验证码却比较幸运,有迹可循.在此,给 ...

随机推荐

【在线工具】java开发常用在线工具
转自:常用工具页面 Java源代码搜索 Grepcode是一个面向于Java开发人员的网站,在这里你可以通过Java的projects.classes等各种关键字在线查看它对应的源码,知道对应的pro ...
AcWing 201. 可见的点（欧拉函数打表）打卡
在一个平面直角坐标系的第一象限内,如果一个点(x,y)与原点(0,0)的连线中没有通过其他任何点,则称该点在原点处是可见的. 例如,点(4,2)就是不可见的,因为它与原点的连线会通过点(2,1). 部 ...
Python代码规范问题及解决
Python代码规范问题及解决为了养成使用Python编程好习惯,尽量保证自己写的代码符合PEP8代码规范,下面是过程中报出的警告及解决方法,英文有些翻译不太准确见谅,会不断更新: PEP 8 只是 ...
SimpleDateFormat("yyyy-MM-dd hh:mm:ss.SSS")时间转换问题
SimpleDateFormat("yyyy-MM-dd hh:mm:ss.SSS")时间转换问题程序代码: import java.text.ParseException; i ...
Ibatis sql语句1
<?xml version="1.0" encoding="UTF-8" ?><!DOCTYPE sqlMap PUBLIC "-/ ...
[已解决]报错:ValueError: Expected 2D array, got scalar array instead
报错代码: new_x = 84610 pre_y = model.predict(new_x) print(pre_y) 报错结果: ValueError: Expected 2D array, g ...
4-vim-工作模式-01-职责以及切换模式
vi 有三种工作模式 1.命令模式打开文件首先进入命令模式,是使用vi的入口. 通过命令对文件进行常规的编辑操作,例如:定位-翻页-复制-粘贴-删除等. 在其他图形编辑器下,通过快捷键或鼠标实现的操 ...
Java 获取当前系统的操作系统类型
版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/fangchao2011/article/d ...
React 生命周期 16.0以下
虽然有人画过了但是自己画一下也能加深记忆吧
PHP之数据连接方法（二）
首先API接口,无非就是通过该程序去处理数据的数据,及判断数据的准确性. 因此我们需要一个DBTool的操作方法. DBTool地址:https://github.com/gfarmhuang/DBT ...

Python-爬虫之股转系统下载文件自动翻页

Python-爬虫之股转系统下载文件自动翻页的更多相关文章

随机推荐

热门专题