1. #-*-coding:utf-8-*-
  2.  
  3. import os
  4. import uuid
  5. import urllib2
  6. import cookielib
  7.  
  8. '''获取文件后缀名'''
  9. def get_file_extension(file):
  10. return os.path.splitext(file)[1]
  11.  
  12. '''創建文件目录,并返回该目录'''
  13. def mkdir(path):
  14. # 去除左右两边的空格
  15. path=path.strip()
  16. # 去除尾部 \符号
  17. path=path.rstrip("\\")
  18.  
  19. if not os.path.exists(path):
  20. os.makedirs(path)
  21.  
  22. return path
  23.  
  24. '''自动生成一个唯一的字符串,固定长度为36'''
  25. def unique_str():
  26. return str(uuid.uuid1())
  27.  
  28. '''
  29. 抓取网页文件内容,保存到内存
  30.  
  31. @url 欲抓取文件 ,path+filename
  32. '''
  33. def get_file(url):
  34. try:
  35. cj=cookielib.LWPCookieJar()
  36. opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
  37. urllib2.install_opener(opener)
  38.  
  39. req=urllib2.Request(url)
  40. operate=opener.open(req)
  41. data=operate.read()
  42. return data
  43. except BaseException, e:
  44. print e
  45. return None
  46.  
  47. '''
  48. 保存文件到本地
  49.  
  50. @path 本地路径
  51. @file_name 文件名
  52. @data 文件内容
  53. '''
  54. def save_file(path, file_name, data):
  55. if data == None:
  56. return
  57.  
  58. mkdir(path)
  59. if(not path.endswith("/")):
  60. path=path+"/"
  61. file=open(path+file_name, "wb")
  62. file.write(data)
  63. file.flush()
  64. file.close()
  65.  
  66. #获取文件后缀名
  67. print get_file_extension("123.jpg");
  68.  
  69. #創建文件目录,并返回该目录
  70. #print mkdir("d:/ljq")
  71.  
  72. #自动生成一个唯一的字符串,固定长度为36
  73. print unique_str()
  74.  
  75. url="http://qlogo1.store.qq.com/qzone/416501600/416501600/100?0";
  76. save_file("d:/ljq/", "123.jpg", get_file(url))

python抓取网页中图片并保存到本地的更多相关文章

  1. php获取网页中图片并保存到本地

    php获取网页中图片并保存到本地的代码,将网页中图片保存本地文件夹: save_img("http://www.jbxue.com" ?>

  2. php获取网页中图片并保存到本地的代码

    php获取网页中图片并保存到本地的代码,将网页中图片保存本地文件夹: <?php /** * 获取网页中图片,并保存至本地 * by www.jbxue.com */ header(" ...

  3. Python抓取网页中的图片到本地

    今天在网上找了个从网页中通过图片URL,抓取图片并保存到本地的例子: #!/usr/bin/env python # -*- coding:utf- -*- # Author: xixihuang # ...

  4. 浅谈如何使用python抓取网页中的动态数据

    我们经常会发现网页中的许多数据并不是写死在HTML中的,而是通过js动态载入的.所以也就引出了什么是动态数据的概念, 动态数据在这里指的是网页中由Javascript动态生成的页面内容,是在页面加载到 ...

  5. python抓取网页中的动态数据

    一.概念 网页中的许多数据并不是写死在HTML中的,而是通过js动态载入的.所以也就引出了什么是动态数据的概念,动态数据在这里指的是网页中由Javascript动态生成的页面内容,是在页面加载到浏览器 ...

  6. 使用wget工具抓取网页和图片 成功尝试

    使用wget工具抓取网页和图片 发表于1年前(2014-12-17 11:29)   阅读(2471) | 评论(14) 85人收藏此文章, 我要收藏 赞7 wget 网页抓取 图片抓取 目录[-] ...

  7. 使用wget工具抓取网页和图片 及 相关工具几个

    想保存一些网页,最后找到这 wget 的 shell脚本,虽然不是太理想,亲测可用呢. 使用wget工具抓取网页和图片   来源 https://my.oschina.net/freestyletim ...

  8. Java 抓取网页中的内容【持续更新】

    背景:前几天复习Java的时候看到URL类,当时就想写个小程序试试,迫于考试没有动手,今天写了下,感觉还不错 内容1. 抓取网页中的URL 知识点:Java URL+ 正则表达式 import jav ...

  9. Python 抓取网页并提取信息(程序详解)

    最近因项目需要用到python处理网页,因此学习相关知识.下面程序使用python抓取网页并提取信息,具体内容如下: #---------------------------------------- ...

随机推荐

  1. log4j配置文件详解

    在开发中经常会碰到日志,网上关于日志的框架也很多,像log4j.self4j.common-logging等,下面对log4j进行介绍. log4j是java开发的日志框架,具有低侵入的特点,其重点使 ...

  2. ahjesus使用T4模板自动维护实体

    在entity项目里新建模板DBEntity.tt <#@ template debug="false" hostspecific="true" lang ...

  3. Android提升篇系列:Android项目代码优化实践

    Android开发中,不同的开发团队,不同的开发人员,在实际编码中会有一些不同的地方.但是,具有一定的更普适性的编码习惯,无疑还是相当重要的.本文主要罗列项目中常见的一些编码片段,并给出相关建议. 1 ...

  4. Java经典实例:实现一个简单堆栈

    堆栈(Stack)是一种常见的数据结构,符合后进先出(First In Last Out)原则,通常用于实现对象存放顺序的逆序.栈的基本操作有push(添加到堆栈),pop(从堆栈删除),peek(检 ...

  5. docker nginx1.7.6+keepalived实现双机热备

    0.前提条件 环境两台ubuntu版本14.04 64位系统(并获取root权限) 假设两台服务器ip为:172.16.34.214(master),172.16.34.215(backup),kee ...

  6. css知多少(4)——解读浏览器默认样式

    上一节<css知多少(3)——样式来源与层叠规则>介绍了样式的五种来源,咱们再通过一张图回顾一下. 对于上面的三层,咱们大概都比较熟悉了.下面的两层中,用户自定义样式一般也就是改一改字号大 ...

  7. sass菜鸟教程

    1.安装sass 在安装sass前需要安装ruby,下载ruby时要注意自己电脑是32位还是64位,下载好正常安装,但注意一下:要勾选下图这一项,添加环境变量(安装过JDK的朋友应该知道环境变量) 下 ...

  8. SAP中查询用户操作日志的事务码

    事务码:STAD 注意:查询的时间跨度范围不要太大,否则会很慢! 事务码:ST03N 工作负载和性能统计

  9. arcmap Command

    The information in this document is useful if you are trying to programmatically find a built-in com ...

  10. SharePoint回环检查(Loopback Check)相关问题

    Loopback Check(回环检查)本来不是一个SharePoint问题,是Windows Server为了增强自身安全性在Server 2003 SP1后引入的一个功能, 在近几个月中导致了一系 ...