批量获取代理ip

获取站大爷免费代理ip，然后打印出来，也可以把他存放在其他容器中

# coding:utf-8

import requests, re

requests.packages.urllib3.disable_warnings()

class IpPool:

    # 获取ip地址

    def getip(self):

        header = {

            "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9",

            "Accept-Encoding": "gzip, deflate, br",

            "Accept-Language": "zh-CN,zh;q=0.9",

            "Cache-Control": "no-cache",

            "Connection": "keep-alive",

            "Cookie": "_qddac=3-4-1.2mthib.7w4yxc.kd1f5iav; __root_domain_v=.zdaye.com; _qddaz=QD.o7ezzx.wk5j9m.kc4mszqh; acw_tc=76b20f6315956673679925039e2bf4f4df78e0869342e377e87dc13e269d33; __51cke__=; _qdda=3-1.2mthib; _qddab=3-7w4yxc.kd1f5iav; _qddamta_2355087264=3-0; acw_sc__v2=5f1bf3aca8364235011db0c32cc514d94a772abe; Hm_lvt_80f407a85cf0bc32ab5f9cc91c15f88b=1593684839,1595667369,1595667382,1595667466; ASPSESSIONIDAEDCAQCD=HIDIHNOBBBHJIMGFNDDABBOF; __tins__16949115=%7B%22sid%22%3A%201595667368811%2C%20%22vd%22%3A%208%2C%20%22expires%22%3A%201595669740633%7D; __51laig__=8; Hm_lpvt_80f407a85cf0bc32ab5f9cc91c15f88b=1595667941",

            "Host": "www.zdaye.com",

            "Pragma": "no-cache",

            "Referer": "https://www.zdaye.com/dayProxy.html",

            "Sec-Fetch-Dest": "document",

            'Sec-Fetch-Mode': "navigate",

            "Sec-Fetch-Site": 'same-origin',

            "Sec-Fetch-User": "?1",

            "Upgrade-Insecure-Requests": "1",

            "User-Agent": "Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.116 Mobile Safari/537.36",

        }

        url = 'https://www.zdaye.com/dayProxy/ip/322896.html'

        response = requests.get(url=url, headers=header, verify=False)

        response.encoding = response.apparent_encoding

        result = re.findall('<br>(.*?)@HTTP', response.text)

        print(result)

        turl = 'https://www.baidu.com'

        # 调用验证IP方法

        self.checkip(turl, result)

    # 验证IP并保存

    def checkip(self, url, ips):

        for ip in ips:

            try:

                proxies = {

                    'http': 'http://%s' % ip,

                    'https': 'https://%s' % ip,

                }

                User_Agent = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36'

                headers = {

                    'User-Agent': User_Agent,

                }

                r = requests.get(url=url, headers=headers, proxies=proxies, timeout=3)

                if r.status_code == 200:

                    print('成功：', ip)

                    f = open('tbip.txt', 'r+', encoding='utf-8')

                    tbips = f.read()

                    tbipstoarray = tbips.split('\n')

                    # 判断如果ip不在ip池里则加入

                    if ip not in tbipstoarray:

                        f.write(ip + '\n')

                    f.close()

            except Exception as e:

                print(e)

if __name__ == '__main__':

    ippool = IpPool()

    ippool.getip()

批量获取代理ip的更多相关文章

python编写的自动获取代理IP列表的爬虫-chinaboywg-ChinaUnix博客
python编写的自动获取代理IP列表的爬虫-chinaboywg-ChinaUnix博客 undefined Python多线程抓取代理服务器 | Linux运维笔记 undefined java如 ...
分享一个获取代理ip的python函数
分享一个获取代理ip的python函数 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 #coding:utf-8 from bs4 import Beaut ...
python爬虫之反爬虫（随机user-agent，获取代理ip，检测代理ip可用性）
python爬虫之反爬虫(随机user-agent,获取代理ip,检测代理ip可用性) 目录随机User-Agent 获取代理ip 检测代理ip可用性随机User-Agent fake_usera ...
Python3.x：获取代理ip以及使用
Python3.x:获取代理ip以及使用 python爬虫浏览器伪装 #导入urllib.request模块 import urllib.request #设置请求头 headers=("U ...
Python学习笔记六(免费获取代理IP)
为获取网上免费代理IP,闲的无聊,整合了一下,免费从三个代理网站获取免费代理IP,目的是在某一代理网站被限制时,仍可从可以访问的其他网站上获取代理IP.亲测可用哦!^_^ 仅供大家参考,以下脚本可添 ...
python爬虫实战（一）——实时获取代理ip
在爬虫学习的过程中,维护一个自己的代理池是非常重要的. 详情看代码: 1.运行环境 python3.x,需求库:bs4,requests 2.实时抓取西刺-国内高匿代理中前3页的代理ip(可根据需求自 ...
python获取代理IP
利用requests库获取代理,用Beautiful库解析网页筛选ip # -*- coding: utf- -*- import requests from bs4 import Beautiful ...
关于Re模块的一些基础知识（另附一段批量抓代理ip的代码）
1.常用匹配规则 . 表示任意字符[0-9] 用来匹配一个指定的字符类别[^5]表示除了5之外的其他字符,^不在字符串的开头,则表示它本身.* 对于前一个字符重复0到无穷次+ 对于前一个字符重复1到无 ...
自动获取代理IP信息的例子，含代码，分享哦，
/// <summary> /// 读取URL数据内容 /// </summary> /// <param name="url">网址</ ...

随机推荐

Tensor的向量化
向量化操作是指可以在同一时间进行批量地并行计算,例如矩阵运算,以达到更好效率的一种方式. 尽量使用向量化直接对Tensor操作,避免低效率的for循环对元素逐个操作.
论文解读（DCN）《Towards K-means-friendly Spaces: Simultaneous Deep Learning and Clustering》
论文信息论文标题:Towards K-means-friendly Spaces: Simultaneous Deep Learning and Clustering论文作者:Bo Yang, Xi ...
POI导出复杂Excel，合并单元格（2）
/** * 导出excel (HSSFWorkbook) */ @GetMapping("/testExport") public void testExport1(HttpSer ...
【Azure Developer】完成算法第4版书中，第一节基础编码中的数组函数 histogrm()
问题描述算法 Algorithms (第四版)书中,第1章:基础编程模型第15题: 结果: 编写一个静态方法 histogram(), 接受一个整型数组a[] 和一个整数M为参数,并返回一个大小为M ...
Codeforces Round #802 (Div. 2)
题集链接 A Optimal Path 水代码 #include <bits/stdc++.h> #define endl "\n" using namespace ...
强化学习-学习笔记12 | Dueling Network
这是价值学习高级技巧第三篇,前两篇主要是针对 TD 算法的改进,而Dueling Network 对 DQN 的结构进行改进,能够大幅度改进DQN的效果. Dueling Network 的应用范围不 ...
手机APP无法抓包HTTPS解决方案
问题表现:某个APP的HTTPS流量抓取不到,Fiddler报错,但可以正常抓取其它的HTTPS流量可能原因: 1.Flutter应用,解决方案:https://www.cnblogs.com/lu ...
LDAP+Gitea统一认证Git服务器账户管理openLdap和微软的ad
很多时候我们需要管理多个内容管理系统,比如Jira.Jenkins.GitEA/Gitlab等等各种管理系统,我们需要每一套管理系统每个人都管理一套密码,每套系统每套密码简直是一种灾难,于是LDAP可 ...
Eslint 项目笔记
1.代码下一行不要验证报错代码的上一行打上注释 <--eslint-disable-next-line-->
Hbase学习（三）过滤器 java API
Hbase学习(三)过滤器 HBase 的基本 API,包括增.删.改.查等. 增.删都是相对简单的操作,与传统的 RDBMS 相比,这里的查询操作略显苍白,只能根据特性的行键进行查询(Get)或者根 ...

批量获取代理ip

批量获取代理ip的更多相关文章

随机推荐

热门专题