Java IO流读写文件的几个注意点

平时写IO相关代码机会挺少的，但却都知道使用BufferedXXXX来读写效率高，没想到里面还有这么多陷阱，这两天突然被其中一个陷阱折腾一下：读一个文件，然后写到另外一个文件，前后两个文件居然不一样？

解决这个问题之后，总结了几个注意点。

注意点一：Reader/Writer读写二进制文件是有问题的 ：

public void copyFile1() {
File srcFile = new File("E://atest//atest.txt");
File dstFile = new File("E://btest//btest.txt");
BufferedReader in = null;
BufferedWriter out = null;
try {
in = new BufferedReader(new FileReader(srcFile));
out = new BufferedWriter(new FileWriter(dstFile));
String line = null;
while((line = in.readLine()) != null) {
out.write(line+"/r/n");
}
}catch (Exception e) {
// TODO: handle exception
e.printStackTrace();
}finally {
if(in != null) {
try {
in.close();
}catch (Exception e) {
// TODO: handle exception
e.printStackTrace();
}
}
if(out != null) {
try {
out.close();
}catch (Exception e) {
// TODO: handle exception
e.printStackTrace();
}
}
}

上面代码使用BufferedReader一行一行地读取一个文件，然后使用BufferedWriter把读取到的数据写到另外一个文件中。如果文件是ASCCII形式的，则内容还是能够正确读取的。但如果文件是二进制的，则读写后的文件与读写前是有很大区别的。当然，把上面的readLine()换成read(char[])仍然不能正确读写二进制文件的。读写二进制文件请接着看下面注意点。

注意点二：read(byte[] b, int offset, int length)中的offset不是指全文件的全文，而是字节数组b的偏移量

现在已经知道使用Reader/Writer不能正确读取二进制文件，这是因为Reader/Writer是字符流，那就改用字节流ufferedInputStream/BufferedOutputStream，网上搜索到的例子大概是这样的：

public void copyFile() {
File srcFile = new File("E://atest//atest.gif");
File dstFile = new File("E://atest//btest.gif");
BufferedInputStream in = null;
BufferedOutputStream out = null;
try {
in = new BufferedInputStream(new FileInputStream(srcFile));
out = new BufferedOutputStream(new FileOutputStream(dstFile));
byte[] b = new byte[1024];
while(in.read(b) != -1) {
out.write(b);
}
}catch (Exception e) {
// TODO: handle exception
e.printStackTrace();
}finally {
if(in != null) {
try {
in.close();
}catch (Exception e) {
// TODO: handle exception
e.printStackTrace();
}
}
if(out != null) {
try {
out.close();
}catch (Exception e) {
// TODO: handle exception
e.printStackTrace();
}
}
}
}

每次读1024字节，然后写1024字节。这看似挺正确的，但实际写出来的文件与原文件是不同的。这样就怀疑可能是读写没有接上，因而把代码改成下面的形式：

byte[] b = new byte[1024];
int offset = 0;
int length = -1;
while((length = in.read(b, offset, 1024)) != -1) {
out.write(b, offset, length);
offset += length;
}

这是误以为：先读一段，写一段，然后改变偏移量，然后使用新的偏移量再读一段、写一段，直到文件读写完毕。但这是错误的，因为使用BufferedXXX后，里面已经实现了这个过程。而read(byte[] b, int offset, int length)中的offset实际指的是把读到的数据存入到数组b时，从数组的哪个位置(即offset)开始放置数据；同理，write(byte[] b, int offset, int length)就是把b中的数据，从哪个位置(offset)开始写到文件中。

注意点三：使用 length=read (b, 0, 1024)读数据时，应该使用write(b, 0, length)来写

第二个注意点中的第一段代码的做法虽然在网上比较常见，但是有问题的。问题在哪呢？答案是：问题在byte[] b这个数组上。由于二进制文件使用比较工具时，只知道不同、但不能知道哪些不同(是否有更先进的比较工具？)。怎样确定它的不同呢？方法很简单：就把二进制文件改成文本文件就能看出结果了(Reader/Writer这种字符流虽然不能正确读写二进制文件，但InputStream/OutputStream这些字节流能既能正确读写二进制文件，也能正确读写文本文件)。由于使用了每次读1K(1024字节)的方式，所以会看到的结果是：写后的文件后面多出一段，这一段的长度与原文件大小以及b数组的大小有关。为了进一步确定是什么关系，把读的文件内容改为"1234567890123"，而把b数组的大小改为10字节，这时结果就出来了：写后的文件内容变成"12345678901234567890"，就是读了两遍。多出的内容的根源在这里：b数组的大小是10字节，而要读的内容长度是13字节，那就要读两次，第一次读了前10字节，此时b数组内的元素为前10个字符；再读第二次时，由于可读内容只有3个字符，那b数组的内容只有前3个字符被改变了，后面7个字符仍然保持上一次读取的内容。所以直接采用write(b)的方式，在第二次写文件时，内容就多写了一段不是第二次读取到的内容。

下面是正确的读写(即每次读了多少内容，写入的是多少内容，而不是写入整个数组)：

public void copyFile() {
File srcFile = new File("E://atest//atest.txt");
File dstFile = new File("E://btest//btest.txt");
BufferedInputStream in = null;
BufferedOutputStream out = null;
try {
in = new BufferedInputStream(new FileInputStream(srcFile));
out = new BufferedOutputStream(new FileOutputStream(dstFile));
int len = -1;
byte[] b = new byte[10];
while((len = in.read(b)) != -1) {
out.write(b, 0, len);
}
}catch (Exception e) {
// TODO: handle exception
e.printStackTrace();
}finally {
if(in != null) {
try {
in.close();
}catch (Exception e) {
// TODO: handle exception
e.printStackTrace();
}
}
if(out != null) {
try {
out.close();
}catch (Exception e) {
// TODO: handle exception
e.printStackTrace();
}
}
}
}

注意点四：flush()和close()

flush()是把写缓冲区内的内容全部”吐“到文件上，如果没有它，就有可能很多内容还存在于写缓冲区内，而不是在文件中，也就是还有丢失的可能。

close()中会调用flush()。它是文件真正完成的标志，文件内容写完成后不关闭文件流，会导致一些”古怪“的问题。这个在网络中的流更能体现。

所以，写文件完成后注意关闭文件读写流。

Java IO流读写文件的几个注意点的更多相关文章

161228、Java IO流读写文件的几个注意点
平时写IO相关代码机会挺少的,但却都知道使用BufferedXXXX来读写效率高,没想到里面还有这么多陷阱,这两天突然被其中一个陷阱折腾一下:读一个文件,然后写到另外一个文件,前后两个文件居然不一样? ...
161108、Java IO流读写文件的几个注意点
平时写IO相关代码机会挺少的,但却都知道使用BufferedXXXX来读写效率高,没想到里面还有这么多陷阱,这两天突然被其中一个陷阱折腾一下:读一个文件,然后写到另外一个文件,前后两个文件居然不一样? ...
Java:IO流与文件基础
Java:IO流与文件基础说明: 本章内容将会持续更新,大家可以关注一下并给我提供建议,谢谢啦. 走进流什么是流流:从源到目的地的字节的有序序列. 在Java中,可以从其中读取一个字节序列的对象 ...
java io流对文件夹的操作
java io流对文件夹的操作检查文件夹是否存在显示文件夹下面的文件 ....更多方法参考 http://www.cnblogs.com/phpyangbo/p/5965781.html ,与文 ...
java io流创建文件、写入数据、设置输出位置
java io流创建文件写入数据改变system.out.print的输出位置 //创建文件 //写入数据 //改变system.out.print的输出位置 import java.io.*; ...
Java IO如何读写文件
Java把这些不同来源和目标的数据都统一抽象为数据流:Java语言的输入输出功能是十分强大而灵活的:在Java类库中,IO部分的内容是很庞大的,因为它涉及的领域很广泛:标准输入输出,文件的操作,网络上 ...
Java 字符流读写文件
据说,java读写文件要写很多,贼麻烦,不像c艹,几行代码就搞定.只能抄抄模板拿来用了. 输入输出流分字节流和字符流.先看看字符流的操作,字节转化为字符也可读写. 一.写入文件 1.FileWrite ...
IO流读写文件
读写文件如前所述,一个流被定义为一个数据序列.输入流用于从源读取数据,输出流用于向目标写数据. 下图是一个描述输入流和输出流的类层次图. 下面将要讨论的两个重要的流是 FileInputStream ...
java IO流 Zip文件操作
一.简介压缩流操作主要的三个类 ZipOutputStream.ZipFile.ZipInputStream ,经常可以看到各种压缩文件:zip.jar.GZ格式的压缩文件二.ZipEntry ...

随机推荐

Numpy中的时间类型
从Numpy1.7开始,已经有了原生的日期-时间支持,基本类型称为datetime64. In [1]: import numpy as np In [2]: nd = np.datetime64(' ...
window.event.keycode值大全
window.event.keycode值大全 event.keycode值大全 1 keycode 8 = BackSpace BackSpace 2 keycode 9 = Tab Tab 3 k ...
Codeforces Round #304 (Div.2)
A. Soldier and Bananas 题意:有个士兵要买w个香蕉,香蕉起步价为k元/个,每多买一个则贵k元.问初始拥有n元的士兵需要借多少钱? 思路:简单题 #include<iostr ...
Uber中国在地方城市的人员架构是怎样的？
http://www.thepaper.cn/newsDetail_forward_1390516 澎湃新闻:Uber中国在地方城市的人员架构是怎样的? 柳甄:一般是3人组成的小团队作战.一名城市 ...
Python面试题之集合推导式、字典推导式
集合推导式集合推导式(set comprehensions)跟列表推导式也是类似的, 唯一的区别在于它们使用大括号{}表示. Code: sets = {x for x in range(10)} ...
CC3中的2D转换
2D转换方法: translate() rotate() scale() skew() matrix() 1.translate()方法,根据左(X轴)和顶部(Y轴)位置给定的参数,从当前元素位置移动 ...
Win32 API编程：显示系统进程列表
#include <windows.h> #include <tlhelp32.h> // 声明快照函数的头文件 #include "tchar.h" #i ...
RN app打包
最近使用React Native做起了移动应用,之前做过一点react,有一点react基础,后来听说RN还不错,就做起了RN项目.为了让辛辛苦苦开发的项目想在手机端运行,就涉及到发布打包. 防止自己 ...
ActiveMQ JMS实现消息发送
一.创建配置消息发送接收目的地. ActiveMQ中间件地址 JMS_BROKER_URL=failover://(tcp://192.168.1.231:61616) QUEUE_BUSP_TP_S ...
高并发情况下分布式全局ID
1.高并发情况下,生成分布式全局id策略2.利用全球唯一UUID生成订单号优缺点3.基于数据库自增或者序列生成订单号4.数据库集群如何考虑数据库自增唯一性5.基于Redis生成生成全局id策略6.Tw ...

Java IO流读写文件的几个注意点

Java IO流读写文件的几个注意点的更多相关文章

随机推荐

热门专题