python 爬爬爬基本函数～

https://docs.python.org/2/howto/urllib2.html#data

http://zhuoqiang.me/python-urllib2-usage.html

 #!/usr/bin/env python

 # -*- coding: utf-8 -*-

 import os

 import urllib

 import urllib2

 import re

 import cookielib

 httpHandler = urllib2.HTTPHandler(debuglevel=1)

 httpsHandler = urllib2.HTTPSHandler(debuglevel=1)

 opener = urllib2.build_opener(httpHandler, httpsHandler)

 urllib2.install_opener(opener)

 headers = {'User-Agent' : 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.118 Safari/537.36'}

 values = {

     #'username':'xxx',

     #'password':'xxx',

 }

 postdata = urllib.urlencode(values)            # 表单

 # GET

 req = urllib2.Request(url='https://www.baidu.com/', data=None, headers=headers)

 response = urllib2.urlopen(req)

 html = response.read()

 response.close()

 print html

 # 图片等二进制数据

 req = urllib2.Request(url='https://www.baidu.com/img/bd_logo1.png', data=postdata, headers=headers)

 operate = opener.open(req)

 data = operate.read()

 operate.close()

 f = open('baidu.png', 'wb')

 f.write(data)

 f.flush()

 f.close()

python 爬爬爬基本函数～的更多相关文章

python爬爬爬之单网页html页面爬取
python爬爬爬之单网页html页面爬取作者:vpoet mail:vpoet_sir@163.com 注:随意copy 不用告诉我 #coding:utf-8 import urllib2 Re ...
Python 爬取所有51VOA网站的Learn a words文本及mp3音频
Python 爬取所有51VOA网站的Learn a words文本及mp3音频 #!/usr/bin/env python # -*- coding: utf-8 -*- #Python 爬取所有5 ...
python爬取网站数据
开学前接了一个任务,内容是从网上爬取特定属性的数据.正好之前学了python,练练手. 编码问题因为涉及到中文,所以必然地涉及到了编码的问题,这一次借这个机会算是彻底搞清楚了. 问题要从文字的编码讲 ...
python爬取某个网页的图片-如百度贴吧
python爬取某个网页的图片-如百度贴吧作者:vpoet mail:vpoet_sir@163.com 注:随意copy,不用告诉我 #coding:utf-8 import urllib imp ...
Python:爬取乌云厂商列表，使用BeautifulSoup解析
在SSS论坛看到有人写的Python爬取乌云厂商,想练一下手,就照着重新写了一遍原帖:http://bbs.sssie.com/thread-965-1-1.html #coding:utf- im ...
使用python爬取MedSci上的期刊信息
使用python爬取medsci上的期刊信息,通过设定条件,然后获取相应的期刊的的影响因子排名,期刊名称,英文全称和影响因子.主要过程如下: 首先,通过分析网站http://www.medsci.cn ...
Python 爬取美团酒店信息
事由:近期和朋友聊天,聊到黄山酒店事情,需要了解一下黄山的酒店情况,然后就想着用python 爬一些数据出来,做个参考主要思路:通过查找,基本思路清晰,目标明确,仅仅爬取美团莫一地区的酒店信息,不过 ...
python爬取免费优质IP归属地查询接口
python爬取免费优质IP归属地查询接口具体不表,我今天要做的工作就是: 需要将数据库中大量ip查询出起归属地刚开始感觉好简单啊,毕竟只需要从百度找个免费接口然后来个python脚本跑一晚上就o ...
Python爬取豆瓣指定书籍的短评
Python爬取豆瓣指定书籍的短评 #!/usr/bin/python # coding=utf-8 import re import sys import time import random im ...

随机推荐

Django配置Bootstrap, js
1.首先在APP目录下创建一个static文件夹如图: # Application definition INSTALLED_APPS = [ 'django.contrib.admin', 'dj ...
Codeforces C. NP-Hard Problem 搜索
C. NP-Hard Problem time limit per test:2 seconds memory limit per test:256 megabytes input:standard ...
Debian 利用 iso 镜像完全离线更新 apt-cdrom
1 目的在日常的 linux 服务器管理中,出于某些考虑,服务器要求与 Internet 完全隔离. 这使得我们对系统的更新和软件包的升级感到无比头疼. 下面介绍的这种方法,采用 ISO 文件,进行 ...
如何将网站部署到tomcat根目录下
更改前访问:http://192.168.1.2/baby 更改后访问:http://192.168.1.2/ 打开tomcat/conf/server.xml找到 <Host name=&qu ...
关于adbd进程的ROOT权限问题
http://blog.csdn.net/a345017062/article/details/6254402 adbd源码位于system/core/adb/目录下,可执行文件位于/sbin/adb ...
乞丐版servlet容器第3篇
4 EventListener接口让我们继续看SocketConnector中的acceptConnect方法: @Override protected void acceptConnect() t ...
2018.10.17 NOIP模拟发电机（概率dp）
传送门考试空间开大了爆零不然只有30分爆栈? 话说这题真的坑1e7没法写dfsdfsdfs 其实很好推式子. 考虑每个点安一个发动机的概率,推一波式子做个等比数列求和什么的可以证明出来是严格的1si ...
2018.09.17 atcoder Tak and Hotels（贪心+分块）
传送门一道有意思的题. 一开始想错了,以为一直lowerlowerlower_boundboundbound就可以解决询问,结果交上去TLE了之后才发现时间复杂度是错的. 但是贪心思想一定是对的,每 ...
MATLAB实现截位的问题
讨论MATLAB怎样提取10进制中的位的方法,因为做FFT时要用到截位,相去验证它,向同庆请教, 原来只是除以2的N次方,取模取余就行了,可恨我还想了一下午,也没有一个好办法. 接下来的问题是,对于负 ...
Exception in thread Thread-3:第三个线程意外
Status:Executing -train.py 02/09/2019 09:33:38 INFO Log level set to: INFO Using TensorFlow backend. ...

python 爬爬爬 基本函数～

python 爬爬爬 基本函数～的更多相关文章

随机推荐

热门专题

python 爬爬爬基本函数～

python 爬爬爬基本函数～的更多相关文章