1. import java.io.File;
  2. import java.io.FileOutputStream;
  3. import java.io.IOException;
  4. import java.io.InputStream;
  5. import java.io.OutputStream;
  6. import java.net.MalformedURLException;
  7. import java.net.URL;
  8. import java.net.URLConnection;
  9.  
  10. import org.jsoup.Connection;
  11. import org.jsoup.Jsoup;
  12. import org.jsoup.nodes.Document;
  13. import org.jsoup.nodes.Element;
  14. import org.jsoup.select.Elements;
  15.  
  16. // 爬取图片
  17. public class Baidu {
  18.  
  19. public static void main(String[] args) {
  20. String urlPath = "http://www.*****.com/chemo/2043_2.html";
  21. int index = 2;
  22. for (int j = 0; j <= 20; j++) {
  23. urlPath = "http://www.****.com/chemo/2043_" + (index++) + ".html";
  24.  
  25. File f = new File("F:/imgs");
  26. if (!f.exists()) {
  27. f.mkdirs();
  28. }
  29.  
  30. Document doc;
  31. try {
  32. doc = Jsoup.connect(urlPath).timeout(10000).get();
  33.  
  34. // 获取后缀为jpg的图片的元素集合
  35. Elements pngs = doc.select("img[src$=.jpg]");
  36. // 遍历元素
  37. for (Element e : pngs) {
  38. String src = e.attr("src");// 获取img中的src路径
  39. // 获取后缀名
  40. String imageName = src.substring(src.lastIndexOf("/") + 1,
  41. src.length());
  42. // 连接url
  43. URL url;
  44. try {
  45. url = new URL(src);
  46. URLConnection uri = url.openConnection();
  47. // 获取数据流
  48. InputStream is = uri.getInputStream();
  49. // 写入数据流
  50. OutputStream os = new FileOutputStream(new File(
  51. "F:/imgs", imageName));
  52.  
  53. byte[] buf = new byte[3072];
  54. int i = 0;
  55. while ((i = is.read()) != -1) {
  56. os.write(i);
  57. }
  58.                 os.close();
  59. } catch (MalformedURLException e1) {
  60. e1.printStackTrace();
  61. } catch (IOException e1) {
  62. e1.printStackTrace();
  63. }
  64.  
  65. }
  66.  
  67. } catch (IOException e2) {
  68. e2.printStackTrace();
  69. }
  70. }
  71.  
  72. }
  73.  
  74. }

这里用的是jsoup1.6.3jar

研究了一天时间,说说碰到的难题。我这里抓取的是以.jpg为主的图片.

当时没有获取图片的后缀名,每次往电脑上下载图片总是新建一个空的文件夹。一定要获取到图片的后缀名才行。

还有一点就是我这个方法不一定适合所有的网站,不同网站的src地址不一样,需要注意一下。

我这个是有20多页的图片,简单用了个循环,每页的地址都有规律,找到规律就手到擒来了。

刚研究,如有高手,还望赐教。

jsoup获取图片示例的更多相关文章

  1. 从Gallery中获取图片示例

    一.MainActivity类 package com.example.gallerydemo; import android.net.Uri; import android.os.Bundle; i ...

  2. Java jsoup获取网页中的图片

    获取图片 package com.vfsd.net; import java.io.File; import java.io.FileOutputStream; import java.io.IOEx ...

  3. 【记录】JS 获取图片原始尺寸-防止图片溢出

    示例代码: <div id="div_content"> <img src="http://static.cnblogs.com/images/logo ...

  4. 利用php获取图片完整Exif信息类 获取图片详细完整信息类

    <?php /** * @Author: TonyLevid * @Copyright: TonyLevid.com * @Name: Image Exif Class * @Version: ...

  5. PHP获取图片颜色值

    PHP获取图片颜色值,检测图片主要颜色的代码: <?php $i=imagecreatefromjpeg("photo3.jpg");//测试图片,自己定义一个,注意路径 f ...

  6. 简单的PHP上传图片和删除图片示例代码

    分享一例简单的PHP上传图片和删除图片示例代码,很简单,适合初学的朋友参考,用来研究php上传图片还是不错的. 1.php上传图片: <?php if (!empty($_FILES[" ...

  7. [Swift]扩展UIImage :获取图片指定像素的颜色值

    对[UIImage]进行扩展 import UIKit extension UIImage{ /** 根据坐标获取图片中的像素颜色值 */ subscript (x: Int, y: Int) -&g ...

  8. (四)Jsoup 获取 DOM 元素属性值

    第一节: Jsoup 获取 DOM 元素属性值 Jsoup获取DOM元素属性值 比如我们要获取博客的href属性值: 我们这时候就要用到Jsoup来获取属性的值 : 我们给下示例代码: package ...

  9. Android -- 加载大图片到内存,从gallery获取图片,获取图片exif信息

    1. 加载大图片到内存,从gallery获取图片 android默认的最大堆栈只有16M, 图片像素太高会导致内存不足的异常, 需要将图片等比例缩小到适合手机屏幕分辨率, 再加载. 从gallery ...

随机推荐

  1. jdk安装问题--javac不是外部命令

    set java_home=C:\Program Files\Java\jdk1.6.0_26   安装JDK的根目录 set classpath=%JAVA_HOME%\lib\tools.jar; ...

  2. MarkdownPad2.5 注册码

    邮箱: Soar360@live.com 授权秘钥: GBPduHjWfJU1mZqcPM3BikjYKF6xKhlKIys3i1MU2eJHqWGImDHzWdD6xhMNLGVpbP2M5SN6b ...

  3. BZOJ 题目整理

    bzoj 500题纪念 总结一发题目吧,挑几道题整理一下,(方便拖板子) 1039:每条线段与前一条线段之间的长度的比例和夹角不会因平移.旋转.放缩而改变,所以将每条轨迹改为比例和夹角的序列,复制一份 ...

  4. SecureCRT 常用命令

    常用命令:一.ls 只列出文件名 (相当于dir,dir也可以使用) -A:列出所有文件,包含隐藏文件. -l:列表形式,包含文件的绝大部分属性. -R:递归显示. --help:此命令的帮助. 二. ...

  5. repo 修改邮箱地址

    需要重新运行 repo init 被带上参数: --config-name xx@a.com

  6. HTML 保存图片到本地

    具体方法有两种  一种是 利用canvas的 toDataUrl  和Html5 里面的 <a>标签里面的 Download 属性 虽然 Download 的兼容性不怎么样  但是在文章后 ...

  7. in (1,2)and in('1,2')解决

    select wm_concat(org_name) from mstorg where instr((select pass_dists from licrequests where req_no= ...

  8. json 序列化为数组

    我们通常从后台取到json格式的数据到前台进行展示,在这个过程中可能户遇到一些json格式不是自己想要的格式,今天本人就遇到一个棘手的问题,最后在师傅的协助下才进行了正确格式的转换. 可以说最悲哀的莫 ...

  9. mvc架构

    mvc是三个单词的缩写,他们是Model(模型),view(视图),controller(控制) 1)最上面的一层,是直接面向最终用户的"视图层"(View).它是提供给用户的操作 ...

  10. iOS 企业证书的使用文档

    IN-HOUSE应用程序分发 下面介绍下使用网络方式进行部署的方式,用户直接在iPhone/iPad的Safari浏览器里面输入URL地址即可安装, 注意:目前对于这种企业级开发的应用程序最好的分发方 ...