关于对inputstream流的复制

今天因为项目需要，获取到一个inputstream后，可能要多次利用它进行read的操作。由于流读过一次就不能再读了，所以得想点办法。

而InputStream对象本身不能复制，因为它没有实现Cloneable接口。此时，可以先把InputStream转化成ByteArrayOutputStream，后面要使用InputStream对象时，再从ByteArrayOutputStream转化回来就好了。代码实现如下：

InputStream input = httpconn.getInputStream();
ByteArrayOutputStream baos = new ByteArrayOutputStream();
byte[] buffer = new byte[1024];
int len;
while ((len = input.read(buffer)) > -1 ) {
baos.write(buffer, 0, len);
}
baos.flush();
InputStream stream1 = new ByteArrayInputStream(baos.toByteArray());
//TODO:显示到前台
InputStream stream2 = new ByteArrayInputStream(baos.toByteArray());
//TODO:本地缓存

InputStream input =  httpconn.getInputStream();

ByteArrayOutputStream baos = new ByteArrayOutputStream();

byte[] buffer = new byte[1024];

int len;

while ((len = input.read(buffer)) > -1 ) {

	baos.write(buffer, 0, len);

}

baos.flush();	           

InputStream stream1 = new ByteArrayInputStream(baos.toByteArray());

//TODO:显示到前台

InputStream stream2 = new ByteArrayInputStream(baos.toByteArray());

//TODO:本地缓存

这种适用于一些不是很大的流，因为缓存流是会消耗内存的，还有一种方法是用到了流的mark 和 reset方法。
其实InputStream本身提供了三个接口： 第一个，InputStream是否支持mark，默认不支持。

public boolean markSupported() {
return false;
}

public boolean markSupported() {

   return false;

}

第二个，mark接口。该接口在InputStream中默认实现不做任何事情。

public synchronized void mark(int readlimit) {}

public synchronized void mark(int readlimit) {}

第三个，reset接口。该接口在InputStream中实现，调用就会抛异常。

public synchronized void reset() throws IOException {
throw new IOException("mark/reset not supported");
}

public synchronized void reset() throws IOException {

   throw new IOException("mark/reset not supported");

}

从三个接口定义中可以看出，首先InputStream默认是不支持mark的，子类需要支持mark必须重写这三个方法。 第一个接口很简单，就是标明该InputStream是否支持mark。 mark接口的官方文档解释： “在此输入流中标记当前的位置。对 reset 方法的后续调用会在最后标记的位置重新定位此流，以便后续读取重新读取相同的字节。  readlimit 参数告知此输入流在标记位置失效之前允许读取许多字节。  
mark 的常规协定是：如果方法 markSupported 返回 true，则输入流总会在调用 mark 之后记住所有读取的字节，并且无论何时调用方法 reset ，都会准备再次提供那些相同的字节。但是，如果在调用 reset 之前可以从流中读取多于 readlimit 的字节，则根本不需要该流记住任何数据。” 
reset接口的官方文档解释：   将此流重新定位到对此输入流最后调用 mark 方法时的位置。   reset 的常规协定是：  
 如果方法 markSupported 返回 true，则：   如果创建流以来未调用方法 mark，或最后调用 mark 以来从该流读取的字节数大于最后调用 mark 时的参数，则可能抛出 IOException。   如果未抛出这样的 IOException，则将该流重新设置为这种状态：最近调用 mark 以来（或如果未调用 mark，则从文件开始以来）读取的所有字节将重新提供给 read 方法的后续调用方，后接可能是调用 reset 时的下一输入数据的所有字节。   如果方法 markSupported 返回 false，则：   对 reset 的调用可能抛出 IOException。   如果未抛出 IOException，则将该流重新设置为一种固定状态，该状态取决于输入流的特定类型和其创建方式的固定状态。提供给 read 方法的后续调用方的字节取决于特定类型的输入流。    
 简而言之就是：  调用mark方法会记下当前调用mark方法的时刻，InputStream被读到的位置。  调用reset方法就会回到该位置。  举个简单的例子：

String content = "BoyceZhang!";
InputStream inputStream = new ByteArrayInputStream(content.getBytes());
// 判断该输入流是否支持mark操作
if (!inputStream.markSupported()) {
System.out.println("mark/reset not supported!");
}
int ch;
boolean marked = false;
while ((ch = inputStream.read()) != -1) {
//读取一个字符输出一个字符
System.out.print((char)ch);
//读到 'e'的时候标记一下
if (((char)ch == 'e')& !marked) {
inputStream.mark(content.length()); //先不要理会mark的参数
marked = true;
}
//读到'!'的时候重新回到标记位置开始读
if ((char)ch == '!' && marked) {
inputStream.reset();
marked = false;
}
}
//程序最终输出：BoyceZhang!Zhang!

String content = "BoyceZhang!";

InputStream inputStream = new ByteArrayInputStream(content.getBytes());

// 判断该输入流是否支持mark操作

if (!inputStream.markSupported()) {

    System.out.println("mark/reset not supported!");

}

int ch;

boolean marked = false;

while ((ch = inputStream.read()) != -1) {

    //读取一个字符输出一个字符

    System.out.print((char)ch);

    //读到 'e'的时候标记一下

     if (((char)ch == 'e')& !marked) {

        inputStream.mark(content.length());  //先不要理会mark的参数

         marked = true;

     }  

     //读到'!'的时候重新回到标记位置开始读

      if ((char)ch == '!' && marked) {

          inputStream.reset();

          marked = false;

      }

}

//程序最终输出：BoyceZhang!Zhang!

看了这个例子之后对mark和reset接口有了很直观的认识。 但是mark接口的参数readlimit究竟是干嘛的呢？ 我们知道InputStream是不支持mark的。要想支持mark子类必须重写这三个方法，我想说的是不同的实现子类，mark的参数readlimit作用不尽相同。 常用的FileInputStream不支持mark。 1. 对于BufferedInputStream，readlimit表示：InputStream调用mark方法的时刻起，在读取readlimit个字节之前，标记的该位置是有效的。如果读取的字节数大于readlimit，可能标记的位置会失效。 
在BufferedInputStream的read方法源码中有这么一段：

} else if (buffer.length >= marklimit) {
markpos = -1; /* buffer got too big, invalidate mark */
pos = 0; /* drop buffer contents */
} else { /* grow buffer */

} else if (buffer.length >= marklimit) {

     markpos = -1;   /* buffer got too big, invalidate mark */

     pos = 0;        /* drop buffer contents */

     } else {            /* grow buffer */

为什么是可能会失效呢？ 因为BufferedInputStream读取不是一个字节一个字节读取的，是一个字节数组一个字节数组读取的。 例如，readlimit=35，第一次比较的时候buffer.length=0（没开始读）<readlimit 然后buffer数组一次读取48个字节。这时的read方法只会简单的挨个返回buffer数组中的字节，不会做这次比较。直到读到buffer数组最后一个字节（第48个）后，才重新再次比较。这时如果我们读到buffer中第47个字节就reset。mark仍然是有效的。虽然47>35。 
2. 对于InputStream的另外一个实现类：ByteArrayInputStream，我们发现readlimit参数根本就没有用，调用mark方法的时候写多少都无所谓。

public void mark(int readAheadLimit) {
mark = pos;
}
public synchronized void reset() {
pos = mark;
}

public void mark(int readAheadLimit) {

   mark = pos;

}

public synchronized void reset() {

   pos = mark;

}

因为对于ByteArrayInputStream来说，都是通过字节数组创建的，内部本身就保存了整个字节数组，mark只是标记一下数组下标位置，根本不用担心mark会创建太大的buffer字节数组缓存。 
3. 其他的InputStream子类没有去总结。原理都是一样的。 
所以由于mark和reset方法配合可以记录并回到我们标记的流的位置重新读流，很大一部分就可以解决我们的某些重复读的需要。  这种方式的优点很明显：不用缓存整个InputStream数据。对于ByteArrayInputStream甚至没有任何的内存开销。  当然这种方式也有缺点：就是需要通过干扰InputStream的读取细节，也相对比较复杂。

关于对inputstream流的复制的更多相关文章

Java实现inputstream流的复制
获取到一个inputstream后,可能要多次利用它进行read的操作.由于流读过一次就不能再读了,而InputStream对象本身不能复制,而且它也没有实现Cloneable接口,所以得想点办法. ...
IO流，字节流复制文件，字符流+缓冲复制文件
JAVAIO如果按流向分:输入流和输出流两种输入流的基类:InputStream Reader 输出流的基类:OutputStream Writer 如果按数据单元划分:字节流和字符流字节 ...
Java基础知识强化之IO流笔记39：字符流缓冲流之复制文本文件案例01
1. 字符流缓冲流之复制文本文件案例需求:把当前项目目录下的a.txt内容复制到当前项目目录下的b.txt中数据源: a.txt -- 读取数据 -- 字符转换流 -- InputStreamRe ...
InputStream流无法重复读取的解决办法
前言:今天工作的需要需要读取aws云上S3桶里面的PDF数据,第一步能够正常的获取PDF文件的InputStream流,然后,我为了测试使用了IOUtils.toString(is)将流System. ...
Java io流完成复制粘贴功能
JAVA 中io字节输入输出流完成复制粘贴功能: public static void main(String[] args) throws Exception{ // 创建输入流要读 ...
Java基础知识强化之IO流笔记41：字符流缓冲流之复制文本文件案例02（使用 [ newLine() / readLine() ] ）（重要）
1. 使用字符流缓冲流的特殊功能 [ newLine() / readLine() ] 需求:把当前项目目录下的a.txt内容复制到当前项目目录下的b.txt中数据源: a.txt -- 读取数据 ...
java学习笔记之字符流文件复制
字符文件复制 FileReader fr =new FileReader("b.txt");//绑定源文件 FileWriter fw= new FileWriter(" ...
JAVA IO流 InputStream流 Read方法
read()首先我们来看这个没有参数的read方法,从(来源)输入流中(读取的内容)读取数据的下一个字节到(去处)java程序内部中,返回值为0到255的int类型的值,返回值为字符的ACSII值(如 ...
Java之字符流操作-复制文件
package test_demo.fileoper; import java.io.*; /* * 字符输入输出流操作,复制文件 * 使用缓冲流扩展,逐行复制 * */ public class F ...

随机推荐

Android Camera进行拍照
Android应用提供了Camera来控制拍照,使用Camera进行拍照的步骤: 1.调用Camera的open()方法打开相机. 2.调用Camera的getParameters()方法获取拍照参数 ...
windowsAzure模拟器错误
Failed to initialize Microsoft Azure storage emulator. Unable to open wait handle 无法初始化微软Azure存储模拟器. ...
Padding Oracle Attack的一些细节与实现
Padding Oracle Attack还是颇具威力的,ASP.NET的Padding Oracle Attack被Pwnie评为2010年最佳服务端漏洞之一.还是看 Juliano Rizzo a ...
What is a watch descriptor
http://stackoverflow.com/questions/24342156/what-are-watch-descriptors-really-linux-inotify-subsyste ...
fastcoloredtextbox控件看下是否解决了中文
该控件解决中文网址未测试是否解决想保存 http://www.dullong.com/share-a-code-can-be-highlighted-components-fastco ...
cd hit使用
~~和唐老师一个实验室的人开发的~~ CD-HIT is a very widely used program for clustering and comparing protein or nucl ...
网页左上角图标 favicon.ico
显示网页左上角标志图标 <link rel="shortcut icon" type="image/x-icon" href="images/f ...
TCP链接时主动close时可能的rst报文
阿里核心系统团队博客http://csrd.aliapp.com/?p=1055记录了主动关闭TCP socket时,可能不发fin包,而是发rst的问题. 其原因是主动关闭socket时,若接收bu ...
2015GitWebRTC编译实录14
libvpx 尝试用脚本编译了下,发现有问题,就偃旗息鼓,改用他自己的configure了,在网上找了下,Git上有个现成的,直接用,更好些. https://github.com/brion/VPX ...
segmentation fault
今天在hanoi问题上出现了segmentation fault 在gcc编译的过程中没出现error,然而程序运行到一半就出现segmentation fault: 上网发现这条语句是非法的内存 ...

关于对inputstream流的复制

关于对inputstream流的复制的更多相关文章

随机推荐

热门专题