java小工具：通过URL连接爬取资源（图片）

java语言编写一个简单爬取网站图片工具，实现简单：

通过 java.net.HttpURLConnection 获取一个URL连接
HttpURLConnection 连接成功返回一个java.io.InputStream，通过InputStream读取图片放入到字节数组buff
通过BufferedOutputStream(new FileOutputStream(new File("TEST.jpg"))) 形式将内存buff里的图片数据写入到test.jpg文件中

给出工具类的CatchIMG.java代码如下：

/**

* @Title: CatchIMG.java

* @Package web1203.tools

* @Description: TODO(用一句话描述该文件做什么)

* @author penny

* @date 2017年12月3日 下午9:00:05

* @version V1.0

*/

package web1203.tools;

import java.io.BufferedInputStream;

import java.io.BufferedOutputStream;

import java.io.File;

import java.io.FileOutputStream;

import java.io.IOException;

import java.io.InputStream;

import java.io.OutputStream;

import java.net.HttpURLConnection;

import java.net.MalformedURLException;

import java.net.URL;

/**

 * @ClassName: CatchIMG

 * @Description: 爬取一个指定地址的网络图片

 * @author penny

 * @date 2017年12月3日 下午9:00:05

 *

 */

public class CatchIMG {

	/**

	 *

	 * @Title: getImg

	 * @Description: 通过一个url 去获取图片

	 * @param @param url 图片的连接地址

	 * @param @throws IOException

	 * @throws

	 */

	public static void getImg(String url) throws IOException{

		long startTime = System.currentTimeMillis();

		URL imgURL = new URL(url.trim());//转换URL

		HttpURLConnection urlConn = (HttpURLConnection) imgURL.openConnection();//构造连接

		urlConn.setRequestProperty("User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.79 Safari/537.36");

		urlConn.connect();

		System.out.println(CatchIMG.class.toString()+":获取连接="+urlConn.getResponseMessage());

		if(urlConn.getResponseCode()==200){//返回的状态码是200 表示成功

			InputStream ins = urlConn.getInputStream(); //获取输入流,从网站读取数据到 内存中

			OutputStream out = new BufferedOutputStream(new FileOutputStream(new File("TEST.jpg")));

			int len=0;

			byte[] buff = new byte[1024*10];//10k缓冲流 视你内存大小而定咯

			while(-1!=(len=(new BufferedInputStream(ins)).read(buff))){//长度保存到len,内容放入到 buff

				out.write(buff, 0, len);//将图片数组内容写入到图片文件

//				System.out.println(CatchIMG.class.toString()+":"+len+"byte已经写入到文件中，内容:  "+new String(buff));

			}

			urlConn.disconnect();

			ins.close();

			out.close();

			System.out.println(CatchIMG.class.toString()+"：获取图片完成,耗时="+((System.currentTimeMillis()-startTime)/1000)+"s");

		}

	}

	/**

	 * @throws IOException

	 * @Title: main

	 * @Description: 测试方法

	 * @throws

	 */

	public static void main(String[] args) throws IOException {

		CatchIMG.getImg("https://files.cnblogs.com/files/humi/wc.bmp");//

	}

}

测试中要获取的图片是这个https://files.cnblogs.com/files/humi/wc.bmp

最终效果

imgraber

*** 一个自己写的java 爬虫基于jsoup和swing技术

可以爬取指定一个url网页里面所有图片
并生成所有图片链接 url .txt
生成 img图片保存到软件同目录img文件夹下

链接http://www.cnblogs.com/humi/p/8555000.html

java小工具：通过URL连接爬取资源（图片）的更多相关文章

（java）selenium webdriver爬虫学习--爬取阿里指数网站的每个分类的top50 相关数据；
主题:java 爬虫--爬取'阿里指数'网站的每个分类的top50 相关数据: 网站网址为:http://index.1688.com/alizs/top.htm?curType=offer& ...
java爬虫-简单爬取网页图片
刚刚接触到“爬虫”这个词的时候是在大一,那时候什么都不明白,但知道了百度.谷歌他们的搜索引擎就是个爬虫. 现在大二.再次燃起对爬虫的热爱,查阅资料,知道常用java.python语言编程,这次我选择了 ...
python requests库爬取网页小实例：爬取网页图片
爬取网页图片: #网络图片爬取 import requests import os root="C://Users//Lenovo//Desktop//" #以原文件名作为保存的文 ...
java爬虫爬取资源，小白必须会的入门代码块
java作为目前最火的语言之一,他的实用性也在被无数的java语言爱好者逐渐的开发,目前比较流行的爬取资源,用java来做也更简单一些,下面是爬取网页上所有手机型号,参数等极为简便的数据 packag ...
实用在线小工具 -- Google URL Shortener
实用在线小工具 -- Google URL Shortener 当你想分享一些你觉得有趣的东西,但是那个链接太长,以至于贴上去一大片.比如在微博上分享一张图片,然后贴上去图片的链接,url ...
python3爬取1024图片
这两年python特别火,火到博客园现在也是隔三差五的出现一些python的文章.各种开源软件.各种爬虫算法纷纷开路,作为互联网行业的IT狗自然看的我也是心痒痒,于是趁着这个雾霾横行的周末瞅了两眼,作 ...
Python爬虫学习（6）: 爬取MM图片
为了有趣我们今天就主要去爬取以下MM的图片,并将其按名保存在本地.要爬取的网站为: 大秀台模特网 1. 分析网站进入官网后我们发现有很多分类: 而我们要爬取的模特中的女模内容,点进入之后其网址为:h ...
python3爬取女神图片，破解盗链问题
title: python3爬取女神图片,破解盗链问题 date: 2018-04-22 08:26:00 tags: [python3,美女,图片抓取,爬虫, 盗链] comments: true ...
Scrapy爬取美女图片续集 (原创)
上一篇咱们讲解了Scrapy的工作机制和如何使用Scrapy爬取美女图片,而今天接着讲解Scrapy爬取美女图片,不过采取了不同的方式和代码实现,对Scrapy的功能进行更深入的运用.(我的新书< ...

随机推荐

tomcat注册成服务
1>修改"bin\service.bat"文件服务名:下图中的SERVICE_NAME 服务显示名称:下图中的DISPLAYNAME 服务描述:Description 2& ...
数据库连接池Flask-SQLAlchemy中多线程安全的问题
使用flask-sqlalchemy写代码码到一半,突然想到,Session是否是线程安全的?于是上官方文档,答案是否! 那问题来了,怎么破?因为它会牵涉到多线程情况下,调用rollback导致的不可 ...
Promise和Generator
异同: 1.promise解决的是串行的嵌套异步问题. 2.yield把Generator Function切割为有多个出口的Generation. 3.Promise是社区的研发产物,yield是E ...
CerntOS7下搭建git服务器
(1).安装git yum安装git,需要ssh的支持.某些版本需要安装git-core,那才是服务器. [root@youxi1 ~]# yum -y install git 创建git用户 [ro ...
在Excel多个工作表间快速切换的绝招
在Excel多个工作表间快速切换的绝招几乎每个Excel用户"数据分析师"都应该知道,如果一个Excel工作簿中包括许多个工作表,我们"数据分析师"可以通过单 ...
git clone时加上--depth 1
当项目过大时,git clone时会出现error: RPC failed; HTTP curl The requested URL returned error: Gateway Time-out的 ...
PHP和MySQL.Web开发(原书第4版)学习盲点笔记
1.浏览器输出中文乱码解决: <?php header("Content-type: text/html; charset=utf-8"); ?> 相当于html中的: ...
ELK之elasticsearch7版本集群设置
ELK7版本搭建参考:https://www.cnblogs.com/minseo/p/10948632.html node-1已经安装配置好配置文件如下 [root@salt-test conf. ...
Egret入门学习日记 --- 第十九篇（书中 8.8~8.10 节内容）
第十九篇(书中 8.8~8.10 节内容) 开始 8.8节. 重点: 1.类型推断. 2.类型强制转换,使其拥有代码提示功能. 3.除了TS自带的类型判断,Egret官方也提供了类型判断的方法. 操 ...
Egret入门学习日记 --- 第十七篇（书中 7.4~8.2节内容）
第十七篇(书中 7.4~8.2节内容) 昨天看到 7.3 节,那么今天. 开始 7.4节. 好吧,这些其他的服务器运行知识,就不搞了... 至此,7.4节内容结束. 开始 7.5节内容. ...

java小工具：通过URL连接爬取资源（图片）

imgraber

java小工具：通过URL连接爬取资源（图片）的更多相关文章

随机推荐

热门专题