Socket缓冲区探讨，是否有拆包的方式?

Socket缓冲区探讨

       本文主要探讨java网络套接字传输模型，并对如何将NIO应用于服务端，提高服务端的运行能力和降低服务负载。

       1.1 socket套接字缓冲区

      Java提供了便捷的网络编程模式，尤其在套接字中，直接提供了与网络进行沟通的输入和输出流，用户对网络的操作就如同对文件操作一样简便。在客户端与服务端建立Socket连接后，客户端与服务端间的写入和写出流也同时被建立，此时即可向流中写入数据，也可以从流中读取数据。在对数据流进行操作时，很多人都会误以为，客户端和服务端的read和write应当是对应的，即：客户端调用一次写入，服务端必然调用了一次写出，而且写入和写出的字节数应当是对应的。为了解释上面的误解，我们提供了Demo-1的示例。

       在Demo-1中服务端先向客户端输出了两次，之后刷新了输出缓冲区。客户端先向服务端输出了一次，然后刷新输出缓冲，之后调用了一次接收操作。从Demo-1源码以及后面提供的可能出现的结果可以看出，服务端和客户端的输入和输出并不是对应的，有时一次接收操作可以接收对方几次发过来的信息，并且不是每次输出操作对方都需要接收处理。当然了Demo-1的代码是一种错误的编写方式，没有任何一个程序员希望编写这样的代码。

Demo-1

package com.upc.upcgrid.guan.chapter02;

import java.io.IOException;

import java.net.ServerSocket;

import java.net.Socket;

import java.net.UnknownHostException;

import org.junit.Test;

public class SocketWriteTest {

    public static final int PORT = 12123;

    public static final int BUFFER_SIZE = 1024;

    //服务端代码

    @Test

    public void server() throws IOException, InterruptedException{

       ServerSocket ss = new ServerSocket(PORT);

       while(true)

       {

           Socket s = ss.accept();

           //这里向网络进行两次写入

           s.getOutputStream().write("hello ".getBytes());

           s.getOutputStream().write("guanxinquan ".getBytes());

           s.getOutputStream().flush();

           s.close();

       }

    }

    //客户端代码

    @Test

    public void client() throws UnknownHostException, IOException{

       byte[] buffer;

       Socket s = new Socket("localhost",PORT);//创建socket连接

       s.getOutputStream().write(new byte[BUFFER_SIZE]);

       s.getOutputStream().flush();

       int i = s.getInputStream().read(buffer = new byte[BUFFER_SIZE]);

       System.out.println(new String(buffer,0,i));

    }

}

Demo-1可能输出的结果：

结果1：

hello

结果2：

hello guanxinquan

       为了深入理解网络发送数据的流程，我们需要对Socket的数据缓冲区有所了解。在创建Socket后，系统会为新创建的套接字分配缓冲区空间。这时套接字已经具有了输入缓冲区和输出缓冲区。可以通过Demo-2中的方式来获取和设置缓冲区的大小。缓冲区大小需要根据具体情况进行设置，一般要低于64K（TCP能够指定的最大负重载数据量，TCP的窗口大小是由16bit来确定的），增大缓冲区可以增大网络I/O的性能，而减少缓冲区有助于减少传入数据的backlog（就是缓冲长度，因此提高响应速度）。对于Socket和SeverSocket如果需要指定缓冲区大小，必须在连接之前完成缓冲区的设定。

Demo-2

package com.upc.upcgrid.guan.chapter02;

import java.net.Socket;

import java.net.SocketException;

public class SocketBufferTest {

    public static void main(String[] args) throws SocketException {

       //创建一个socket

       Socket socket = new Socket();

       //输出缓冲区大小

       System.out.println(socket.getSendBufferSize());

       System.out.println(socket.getReceiveBufferSize());

       //重置缓冲区大小

       socket.setSendBufferSize(1024*32);

       socket.setReceiveBufferSize(1024*32);

       //再次输出缓冲区大小

       System.out.println(socket.getSendBufferSize());

       System.out.println(socket.getReceiveBufferSize());

    }

}

Demo-2的输出：

8192

8192

32768

32768

       了解了Socket缓冲区的概念后，需要探讨一下Socket的可写状态和可读状态。当输出缓冲区未满时，Socket是可写的（注意，不是对方启用接收操作后，本地才能可写，这是错误的理解），因此，当套接字被建立时，即处于可写如的状态。对于可读，则是指缓冲区中有接收到的数据，并且这些数据未完成处理。在socket创建时，并不处于可读状态，仅当连接的另一方向本套接字的通道写入数据后，本套接字方能处于可读状态（注意，如果对方套接字已经关闭，那么本地套接字将处于可读状态，并且每次调用read后，返回的都是-1）。

       现在应用前面的讨论，重新分析一下Demo-1的执行流程，服务端与客户端建立连接后，服务器端先向缓冲区写入两条信息，在第一条信息写入时，缓冲区并未写满，因此在第二条信息输入时，第一条信息很可能还未发送，因此两条信息可能同时被传送到客户端。另一方面，如果在第二条信息写入时，第一条已经发送出去，那么客户端的接收操作仅会获得第一条信息，因为客户端没有继续接收的操作，因此第二条信息在缓冲区中，将不会被读取，当socket关闭时，缓冲区将被释放，未被读取的数据也就变的无效了。如果对方的socket已经关闭，本地再次调用读取方法，则读取方法直接返回-1，表示读到了文件的尾部。

       对于缓冲区空间的设定，要根据具体情况来定，如果存在大量的长信息（比如文件传输），将缓冲区定义的大些，可能更好的利用网络资源，如果更多的是短信息（比如聊天消息），使用小的缓冲区可能更好些，这样刷新的速度会更快。一般系统默认的缓冲大小是8*1024。除非对自己处理的情况很清晰，否则请不要随意更改这个设置。

       由于可读状态是在对方写入数据后或socket关闭时才能出现，因此如果客户端和服务端都停留在read时，如果没有任何一方，向对方写入数据，这将会产生一个死锁。

       此外，在本地接收操作发起之前，很可能接收缓冲区中已经有数据了，这是一种异步。不要误以为，本地调用接收操作后，对方才会发送数据，实际数据何时到达，本地不能做出任何假设。

       如果想要将多条输入的信息区分开，可以使用一些技巧，在文件操作中使用-1表示EOF，就是文件的结束，在网络传输中，也可以使用-1表示一条传输语句的结束。Demo-3中给出了一个读取和写入操作，在客户端和服务端对称的使用这两个类，可以将每一条信息分析出来。Demo-3中并不是将网络的传输同步，而是分析出缓冲中的数据，将以-1为结尾进行数据划分。如果写聊天程序可以使用类似的模式。

Demo-3

package com.upc.upcgrid.guan.chapter02;

import java.io.IOException;

import java.io.InputStream;

import java.io.OutputStream;

import java.net.ServerSocket;

import java.net.Socket;

import java.net.UnknownHostException;

import java.nio.ByteBuffer;

import java.util.ArrayList;

import java.util.List;

import org.junit.Test;

public class SocketWriteTest {

    public static final int PORT = 12123;

    public static final int BUFFER_SIZE = 1024;

    //读取一条传入的，以-1为结尾的数据

    public class ReadDatas{

       //数据临时缓冲用

       private List<ByteBuffer> buffers = new ArrayList<ByteBuffer>();

       private Socket socket;//数据的来源

       public ReadDatas(Socket socket) throws IOException {

           this.socket = socket;

       }

       public void read() throws IOException

       {

           buffers.clear();//清空上次的读取状态

           InputStream in = socket.getInputStream();//获取输入流

           int k = 0;

           byte r = 0;

           while(true)

           {

              ByteBuffer buffer = ByteBuffer.allocate(BUFFER_SIZE);//新分配一段数据区

              //如果新数据区未满，并且没有读到-1，则继续读取

              for(k = 0 ; k < BUFFER_SIZE ; k++)

              {

                  r = (byte) in.read();//读取一个数据

                  if(r != -1)//数据不为-1，简单放入缓冲区

                     buffer.put(r);

                  else{//读取了一个-1，表示这条信息结束

                     buffer.flip();//翻转缓冲，以备读取操作

                     buffers.add(buffer);//将当前的buffer添加到缓冲列表

                     return;

                  }

              }

              buffers.add(buffer);//由于缓冲不足，直接将填满的缓冲放入缓冲列表

           }

       }

       public String getAsString()

       {

           StringBuffer str = new StringBuffer();

           for(ByteBuffer buffer: buffers)//遍历缓冲列表

           {

              str.append(new String(buffer.array(),0,buffer.limit()));//组织字符串

           }

           return str.toString();//返回生成的字符串

       }

    }

    //将一条信息写出给接收端

    public class WriteDatas{

       public Socket socket;//数据接收端

       public WriteDatas(Socket socket,ByteBuffer[] buffers) throws IOException {

           this.socket = socket;

           write(buffers);

       }

       public WriteDatas(Socket socket) {

           this.socket = socket;

       }

       public  void write(ByteBuffer[] buffers) throws IOException

       {

           OutputStream out = socket.getOutputStream();//获取输出流

           for(ByteBuffer buffer:buffers)

           {

              out.write(buffer.array());//将数据输出到缓冲区

           }

           out.write(new byte[]{-1});//输出终结符

           out.flush();//刷新缓冲区

       }

    }

    //服务端代码

    @Test

    public void server() throws IOException, InterruptedException{

       ServerSocket ss = new ServerSocket(PORT);

       while(true)

       {

           Socket s = ss.accept();

           //从网络连续读取两条信息

           ReadDatas read = new ReadDatas(s);

           read.read();

           System.out.println(read.getAsString());

           read.read();

           System.out.println(read.getAsString());

           //向网络中输出一条信息

           WriteDatas write = new WriteDatas(s);

           write.write(new ByteBuffer[]{ByteBuffer.wrap("welcome to us ! ".getBytes())});

           //关闭套接字

           s.close();

       }

    }

    //客户端代码

    @Test

    public void client() throws UnknownHostException, IOException{

       Socket s = new Socket("localhost",PORT);//创建socket连接

       //连续向服务端写入两条信息

       WriteDatas write = new WriteDatas(s,new ByteBuffer[]{ByteBuffer.wrap("ni hao guan xin quan ! ".getBytes())} );

       write.write(new ByteBuffer[]{ByteBuffer.wrap("let's study java network !".getBytes())});

       //从服务端读取一条信息

       ReadDatas read = new ReadDatas(s);

       read.read();

       System.out.println(read.getAsString());

       //关闭套接字

       s.close();

    }

}

       在Demo-3中的这种消息处理方式过于复杂，需要理解java底层的缓冲区的知识，还需要编程人员完成消息的组合（在消息末尾添加-1），在Java中可以使用一种简单的方式完成上述的操作，就是使用java DataInputStream和DataOutputStream提供的方法。Demo-4给出了使用java相关流类完成同步的消息的方法（估计他们与我们Demo-3使用的方式是相似的）。你可以查阅java其它API，可以找到其他的方式。

Demo-4

package com.upc.upcgrid.guan.chapter02;

import java.io.DataInputStream;

import java.io.DataOutputStream;

import java.io.IOException;

import java.net.ServerSocket;

import java.net.Socket;

import java.net.UnknownHostException;

import org.junit.Test;

public class SocketDataStream {

    public static final int PORT = 12123;

    @Test

    public void server() throws IOException

    {

       ServerSocket ss = new ServerSocket(PORT);

       while(true)

       {

           Socket s = ss.accept();

           DataInputStream in = new DataInputStream(s.getInputStream());

           DataOutputStream out = new DataOutputStream(s.getOutputStream());

           out.writeUTF("hello guan xin quan ! ");

           out.writeUTF("let's study java togethor! ");

           System.out.println(in.readUTF());

           s.close();

       }

    }

    @Test

    public void client() throws UnknownHostException, IOException

    {

       Socket s = new Socket("localhost",PORT);

       DataInputStream in = new DataInputStream(s.getInputStream());

       DataOutputStream out = new DataOutputStream(s.getOutputStream());

       System.out.println(in.readUTF());

       System.out.println(in.readUTF());

       out.writeUTF("welcome to java net world ! ");

       s.close();

    }

}

简单总结：

       上面主要介绍了java Socket通信的缓冲区机制，并通过几个示例让您对java Socket的工作原理有了简单了解。这里需要注意的是可读状态和可写状态，因为这两个概念将对下一节的内容理解至关重要。下一节将描述java NIO提高服务端的并发性。

Socket缓冲区探讨，是否有拆包的方式?的更多相关文章

Socket缓冲区
1.由于可读状态是在对方写入数据后或socket关闭时才能出现,因此如果客户端和服务端都停留在read时,如果没有任何一方,向对方写入数据,这将会产生一个死锁. 2.此外,在本地接收操作发起之前,很可 ...
Linux网卡调优篇-禁用ipv6与优化socket缓冲区大小
Linux网卡调优篇-禁用ipv6与优化socket缓冲区大小作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一般在内网环境中,我们几乎是用不到IPV6,因此我们没有必要把多不 ...
socket缓冲区以及阻塞模式
socket缓冲区每个 socket 被创建后,都会分配两个缓冲区,输入缓冲区和输出缓冲区. write()/send() 并不立即向网络中传输数据,而是先将数据写入缓冲区中,再由TCP协议将数据从 ...
修改帧大小和socket缓冲区大小（转）
修改帧大小和socket缓冲区大小 MTU (最大传输单元)的缺省值为1500. 通过下面命令将其改为9000(jumbo frame) % ifconfig eth0 mtu 9000 socket ...
socket缓冲区以及阻塞模式（七）
一.socket缓冲区每个 socket 被创建后,都会分配两个缓冲区,输入缓冲区和输出缓冲区. 以下用write()/send()表示写数据/发送数据,read()/recv() 表示读数据/接收 ...
C# Socket系列三 socket通信的封包和拆包
通过系列二我们已经实现了socket的简单通信接下来我们测试一下,在时间应用的场景下,我们会快速且大量的传输数据的情况! class Program { static void Main(stri ...
网络笔记01-3 socket 实现百度页面的两种方式
scoket 实现百度页面的两种方式: 1.利用系统自带 //1.创建URL NSURL *url=[NSURL URLWithString:@"http://m.baidu.com& ...
修改socket缓冲区大小
#include <stdio.h>#include <sys/time.h>#include <sys/types.h>#include <sys/sock ...
ss 显示unix 域的socket 缓冲区不正确
一个unix 域socket,平时我们用ss -auxp 来查看是否有数据在内核没有到用户态, [root@localhost unix]# ss -auxp |grep -i server.o u_ ...

随机推荐

Java面试题之Class.forName的作用
按参数中指定的字符串形式的类名去搜索并加载相应的类,如果该类字节码已经被加载过,则返回代表该字节码的Class实例对象,否则,按类加载器的委托机制去搜索和加载该类,如果所有的类加载器都无法加载到该类, ...
C# IL 指令集
跳转指令集合 Public field Static Beq 如果两个值相等,则将控制转移到目标指令.Public field Static Beq_S 如果两个值相等 ...
关于if (!cin)以及while (cin >> word)
首先注意: 1.每一个输入(输出)对象就代表一个输入(输出)流: 2.输入(输出)对象中的流状态成员标记了输入(输出)流当前的状况,当eofbit.badbit.failbit三个标记位均为0时表示流 ...
iOS进阶：Objective-C runtime（一）
第一次看到runtime时,觉得太高大上,动态获取方法.属性等简直厉害的不要不要的.在经过查找资料+实践后,发现runtime并没有想象中那么复杂,接下来对runtime进行基本的介绍. 要使用运行时 ...
并发编程: c++11 thread(Func, Args...)利用类成员函数创建线程
c++11是VS2012后支持的新标准,为并发编程提供了方便的std::thread. 使用示例: #include <thread> void thread_func(int arg1, ...
mysql触发器使用注意
1.在创建触发器的时候,语句中避免在一个select语句查询多个列,例如使用select a,b from table,应该分开使用select语句, 例如select a from table s ...
linux杂记（三）linux指令介绍
[root@linux ~]# command [-options] parameter1 parameter2 说明: 最左边的root显示的是[目前使用者的账号],而@之后接的是linux即[主机 ...
cookie简介
上例子 1.首先要用php创建cookie发送给客户端,利用setcookie()方法即可 <?php /* * * @Authors peng--jun * @Email 1098325951 ...
MVC3 分页Helper
利用mvc3实现分页效果.效果图如下: 直接拷代码: 首页添加一个Helper的类(命名空间为System.Web.Mvc;). public static HtmlString ShowPageNa ...
CentOS下重新安装yum
1,下载最新的yum-3.2.28.tar.gz并解压 #wget http://yum.baseurl.org/download/3.2/yum-3.2.28.tar.gz#tar xvf yum- ...

Socket缓冲区探讨，是否有拆包的方式?

Socket缓冲区探讨，是否有拆包的方式?的更多相关文章

随机推荐

热门专题