python 代理

1.参考

Should you want to use the SOCKS proxy only with urllib2 then the wrapmodule can be used. This replaces a module's socket library with a SOCKS socket[2].

v3.2.0版本中新增的socks5代理设置选项是做什么的？

这个前置代理，应该是给 shadowsocks.exe 本身的代理设置，使得它自己走某个代理。因为有些公司，内网环境下需要代理才可以访问外网。

http,socks4,socks5代理的区别

HTTP代理：能够代理客户机的HTTP访问，主要是代理浏览器访问网页，它的端口一般为80、8080、3128等；
SOCKS代理：SOCKS代理与其他类型的代理不同，它只是简单地传递数据包，而并不关心是何种应用协议，既可以是HTTP请求，所以SOCKS代理服务器比其他类型的代理服务器速度要快得多。SOCKS代理又分为SOCKS4和SOCKS5，二者不同的是SOCKS4代理只支持TCP协议（即传输控制协议），而SOCKS5代理则既支持TCP协议又支持UDP协议（即用户数据包协议），还支持各种身份验证机制、服务器端域名解析等。SOCK4能做到的SOCKS5都可得到，但SOCKS5能够做到的SOCK4则不一定能做到，比如我们常用的聊天工具QQ在使用代理时就要求用SOCKS5代理，因为它需要使用UDP协议来传输数据

极客学院 Requests 库的使用

10-穿墙代理的设置

1.5.socket代理
参见《python中的socket代理》可知，更底层的socket代理如下所示：
import socks, socket
socks.setdefaultproxy(socks.PROXY_TYPE_SOCKS5, "proxy_host", proxy_port)
socket.socket = socks.socksocket
需要 socks 库。

Python爬虫进阶七之设置ADSL拨号服务器代理

tor？

2.urllib2

import urllib2

req = urllib2.Request('http://httpbin.org/ip')

req_https = urllib2.Request('https://httpbin.org/ip')

proxy_http = urllib2.ProxyHandler({'http':'http://127.0.0.1:1080'})

proxy_https = urllib2.ProxyHandler({'https':'https://127.0.0.1:1080'})

opener = urllib2.build_opener(proxy_http, proxy_https)

# urllib2.install_opener(opener)

print urllib2.urlopen(req).read()

print urllib2.urlopen(req_https).read()

print opener.open(req, timeout=10).read()

print opener.open(req_https, timeout=10).read()

3.requests

import requests

# proxies={'http': 'http://127.0.0.1:1080', 'https': 'http://127.0.0.1:1080'}

proxies={'http': 'socks5://127.0.0.1:1080', 'https': 'socks5://127.0.0.1:1080'}

# s.proxies = proxies

print requests.get('http://httpbin.org/ip').content

print requests.get('https://httpbin.org/ip').content

print requests.get('http://httpbin.org/ip', proxies=proxies, timeout=10).content

print requests.get('https://httpbin.org/ip', proxies=proxies, timeout=10).content

4.更加底层 socket.socket

# pip install requests[socks]

import socket

import socks

import requests

default_socket = socket.socket

def get():

    print urllib2.urlopen('http://httpbin.org/ip', timeout=10).read()

    print urllib2.urlopen('https://httpbin.org/ip', timeout=10).read()

    print(requests.get('http://httpbin.org/ip', timeout=10).text)

    print(requests.get('https://httpbin.org/ip', timeout=10).text)

print 'no proxy:'

get()

socks.set_default_proxy(socks.SOCKS5, '127.0.0.1', 1080)

socket.socket = socks.socksocket

print 'proxy:'

get()

socket.socket = default_socket

print 'no proxy:'

get()

python 代理的更多相关文章

python代理池的构建5——对mongodb数据库里面代理ip检查
上一篇博客地址:python代理池的构建4--mongdb数据库的增删改查一.对数据库里面代理ip检查(proxy_test.py) #-*-coding:utf-8-*- ''' 目的:检查代理I ...
python代理池的构建4——mongdb数据库的增删改查
上一篇博客地址:python代理池的构建3--爬取代理ip 一.mongdb数据库的增删改查(Mongo_pool.py) #-*-coding:utf-8-*- ''' 实现代理池的数据库模块 ●作 ...
python代理池的构建3——爬取代理ip
上篇博客地址:python代理池的构建2--代理ip是否可用的处理和检查一.基础爬虫模块(Base_spider.py) #-*-coding:utf-8-*- ''' 目标: 实现可以指定不同UR ...
python代理池的构建2——代理ip是否可用的处理和检查
上一篇博客地址:python代理池的构建1--代理IP类的构建,以及配置文件.日志文件.requests请求头一.代理ip是否可用的处理(httpbin_validator.py) #-*-codi ...
python代理池的构建1——代理IP类的构建，以及配置文件、日志文件、requests请求头
一.整体结构二.代理IP类的构建(domain.py文件) ''' 实现_ init_ 方法, 负责初始化,包含如下字段: ip: 代理的IP地址 port:代理IP的端口号 protocol: 代 ...
python——代理ip获取
python爬虫要经历爬虫.爬虫被限制.爬虫反限制的过程.当然后续还要网页爬虫限制优化,爬虫再反限制的一系列道高一尺魔高一丈的过程. 爬虫的初级阶段,添加headers和ip代理可以解决很多问题. 贴 ...
爬虫的新手使用教程（python代理IP）
前言 Python爬虫要经历爬虫.爬虫被限制.爬虫反限制的过程.当然后续还要网页爬虫限制优化,爬虫再反限制的一系列道高一尺魔高一丈的过程.爬虫的初级阶段,添加headers和ip代理可以解决很多问题. ...
python 代理的使用
这里分享一个测试ip的网址 http://ip.filefab.com/index.php scrapy 随机请求头和代理ip的使用原理 import random # 添加一个中间键 cla ...
python代理爬取存入csv文件
爬取高匿代理 from urllib import request import re import time f = open('西1.csv','w',encoding='GBK') header ...

随机推荐

Java多线程处理某个线程超时的问题
ExecutorService exec = Executors.newFixedThreadPool(4); List<Future<Integer>> futures = ...
json内存级非关系数据库
介绍 `jsonDB2`是一个基于内存的键值对数据库(非关系型数据库) 开发初衷:实现个人tornado项目中内存session存储功能(不想引入redis等非关系型数据库) 项目地址: https: ...
Python 正则处理_re模块
正则表达式动机文本处理成为计算机常见工作之一对文本内容搜索,定位,提取是逻辑比较复杂的工作为了快速方便的解决上述问题,产生了正则表达式技术定义文本的高级匹配模式, 提供搜索, 替换, 本质 ...
[NOI2009]变换序列（二分图匹配）
我们先不考虑字典序最小,先来求出一种可行解. 不难发现,对于每一个i值,它所对应的T值在模n意义下最多两个,于是我们可以用二分图匹配来判断. 那字典序最小呢? 回顾一下二分图匹配的算法:网络流?貌似不 ...
jvm学习笔记一（垃圾回收算法）
一:垃圾回收机制的原因 java中,当没有对象引用指向原先分配给某个对象的内存时候,该内存就成为了垃圾.JVM的一个系统级线程会自动释放该内存块.垃圾回收意味着程序不再需要的对象是"无用信息 ...
Day049--jQuery的文档操作和事件介绍
今日内容 DOM操作(CRUD) js中DOM document.createElement('p') appendChild() insertBefore() removeChild() 创建元素 ...
前端神器之jquery
jquery介绍 jQuery是目前使用最广泛的javascript函数库.据统计,全世界排名前100万的网站,有46%使用jQuery,远远超过其他库.微软公司甚至把jQuery作为他们的官方库. ...
分布式监控系统开发【day37】:填充表配置项目（三）
一.注册站点初始化数据库 1.目录结构 2.初始化数据库 python3 manage.py makemigrations python3 manage.py migrate #django2.0之前 ...
NOI-OJ 1.12 ID:10 素数对
整体思路本题涉及大量素数的使用,故使用埃拉拖色尼算法提前计算出素数表可以避免大量.重复的计算. 判断素数对很简单,使用两个变量p1和p2代表素数表中的第一个和第二个素数,依次在表中向后移动,判断p2 ...
[物理学与PDEs]第4章第3节一维反应流体力学方程组 3.1 一维反应流体力学方程组
1. 一维粘性热传导反应流体力学方程组 $$\beex \bea \cfrac{\p\rho}{\p t}&+\cfrac{\p}{\p x}(\rho u)=0,\\ \cfrac{\p}{ ...