1、摘要

零拷贝的“零”是指用户态和内核态间copy数据的次数为零。

传统的数据copy(文件到文件、client到server等)涉及到四次用户态内核态切换、四次copy。四次copy中,两次在用户态和内核态间copy需要CPU参与、两次在内核态与IO设备间copy为DMA方式不需要CPU参与。零拷贝避免了用户态和内核态间的copy、减少了两次用户态内核态间的切换。

2、介绍

java 的zero copy多在网络应用程序中使用。Java的libaries在linux和unix中支持zero copy,关键的api是java.nio.channel.FileChannel的transferTo(),transferFrom()方法。我们可以用这两个方法来把bytes直接从调用它的channel传输到另一个writable byte channel,中间不会使data经过应用程序,以便提高数据转移的效率。

许多web应用都会向用户提供大量的静态内容,这意味着有很多data从硬盘读出之后,会原封不动的通过socket传输给用户。这种操作看起来可能不会怎么消耗CPU,但是实际上它是低效的:kernal把数据从disk读出来,然后把它传输给user级的application,然后application再次把同样的内容再传回给处于kernal级的socket。这种场景下,application实际上只是作为一种低效的中间介质,用来把disk file的data传给socket。

data每次穿过user-kernel boundary,都会被copy,这会消耗cpu,并且占用RAM的带宽。幸运的是,你可以用一种叫做Zero-Copy的技术来去掉这些无谓的 copy。应用程序用zero copy来请求kernel直接把disk的data传输给socket,而不是通过应用程序传输。Zero copy大大提高了应用程序的性能,并且减少了kernel和user模式的上下文切换

使用kernel buffer做中介(而不是直接把data传到user buffer中)看起来比较低效(多了一次copy)。然而实际上kernel buffer是用来提高性能的。在进行读操作的时候,kernel buffer起到了预读cache的作用。当写请求的data size比kernel buffer的size小的时候,这能够显著的提升性能。在进行写操作时,kernel buffer的存在可以使得写请求完全异步。

悲剧的是,当请求的data size远大于kernel buffer size的时候,这个方法本身变成了性能的瓶颈。因为data需要在disk,kernel buffer,user buffer之间拷贝很多次(每次写满整个buffer)。

而Zero copy正是通过消除这些多余的data copy来提升性能。

3、传统方式及涉及到的上下文切换

通过网络把一个文件传输给另一个程序,在OS的内部,这个copy操作要经历四次user mode和kernel mode之间的上下文切换,甚至连数据都被拷贝了四次,如下图:

具体步骤如下:

  1. read() 调用导致一次从user mode到kernel mode的上下文切换。在内部调用了sys_read() 来从文件中读取data。第一次copy由DMA (direct memory access)完成,将文件内容从disk读出,存储在kernel的buffer中。
  2. 然后请求的数据被copy到user buffer中,此时read()成功返回。调用的返回触发了第二次context switch: 从kernel到user。至此,数据存储在user的buffer中。
  3. send() Socket call 带来了第三次context switch,这次是从user mode到kernel mode。同时,也发生了第三次copy:把data放到了kernel adress space中。当然,这次的kernel buffer和第一步的buffer是不同的buffer。
  4. 最终 send() system call 返回了,同时也造成了第四次context switch。同时第四次copy发生,DMA egine将data从kernel buffer拷贝到protocol engine中。第四次copy是独立而且异步的。

4、zero copy方式及涉及的上下文转换

在linux 2.4及以上版本的内核中(如linux 6或centos 6以上的版本),开发者修改了socket buffer descriptor,使网卡支持 gather operation,通过kernel进一步减少数据的拷贝操作。这个方法不仅减少了context switch,还消除了和CPU有关的数据拷贝。user层面的使用方法没有变,但是内部原理却发生了变化:

transferTo()方法使得文件内容被copy到了kernel buffer,这一动作由DMA engine完成。 没有data被copy到socket buffer。取而代之的是socket buffer被追加了一些descriptor的信息,包括data的位置和长度。然后DMA engine直接把data从kernel buffer传输到protocol engine,这样就消除了唯一的一次需要占用CPU的拷贝操作。

5、Java NIO 零拷贝示例

NIO中的FileChannel拥有transferTo和transferFrom两个方法,可直接把FileChannel中的数据拷贝到另外一个Channel,或直接把另外一个Channel中的数据拷贝到FileChannel。该接口常被用于高效的网络/文件的数据传输和大文件拷贝。在操作系统支持的情况下,通过该方法传输数据并不需要将源数据从内核态拷贝到用户态,再从用户态拷贝到目标通道的内核态,同时也避免了两次用户态和内核态间的上下文切换,也即使用了“零拷贝”,所以其性能一般高于Java IO中提供的方法。

5.1、通过网络把一个文件从client传到server:

  1. /**
  2. * disk-nic零拷贝
  3. */
  4. class ZerocopyServer {
  5. ServerSocketChannel listener = null;
  6.  
  7. protected void mySetup() {
  8. InetSocketAddress listenAddr = new InetSocketAddress(9026);
  9.  
  10. try {
  11. listener = ServerSocketChannel.open();
  12. ServerSocket ss = listener.socket();
  13. ss.setReuseAddress(true);
  14. ss.bind(listenAddr);
  15. System.out.println("监听的端口:" + listenAddr.toString());
  16. } catch (IOException e) {
  17. System.out.println("端口绑定失败 : " + listenAddr.toString() + " 端口可能已经被使用,出错原因: " + e.getMessage());
  18. e.printStackTrace();
  19. }
  20.  
  21. }
  22.  
  23. public static void main(String[] args) {
  24. ZerocopyServer dns = new ZerocopyServer();
  25. dns.mySetup();
  26. dns.readData();
  27. }
  28.  
  29. private void readData() {
  30. ByteBuffer dst = ByteBuffer.allocate(4096);
  31. try {
  32. while (true) {
  33. SocketChannel conn = listener.accept();
  34. System.out.println("创建的连接: " + conn);
  35. conn.configureBlocking(true);
  36. int nread = 0;
  37. while (nread != -1) {
  38. try {
  39. nread = conn.read(dst);
  40. } catch (IOException e) {
  41. e.printStackTrace();
  42. nread = -1;
  43. }
  44. dst.rewind();
  45. }
  46. }
  47. } catch (IOException e) {
  48. e.printStackTrace();
  49. }
  50. }
  51. }
  52.  
  53. class ZerocopyClient {
  54. public static void main(String[] args) throws IOException {
  55. ZerocopyClient sfc = new ZerocopyClient();
  56. sfc.testSendfile();
  57. }
  58.  
  59. public void testSendfile() throws IOException {
  60. String host = "localhost";
  61. int port = 9026;
  62. SocketAddress sad = new InetSocketAddress(host, port);
  63. SocketChannel sc = SocketChannel.open();
  64. sc.connect(sad);
  65. sc.configureBlocking(true);
  66.  
  67. String fname = "src/main/java/zerocopy/test.data";
  68. FileChannel fc = new FileInputStream(fname).getChannel();
  69. long start = System.nanoTime();
  70. long nsent = 0, curnset = 0;
  71. curnset = fc.transferTo(0, fc.size(), sc);
  72. System.out.println("发送的总字节数:" + curnset + " 耗时(ns):" + (System.nanoTime() - start));
  73. try {
  74. sc.close();
  75. fc.close();
  76. } catch (IOException e) {
  77. System.out.println(e);
  78. }
  79. }
  80. }

5.2、文件到文件的零拷贝:

  1. /**
  2. * disk-disk零拷贝
  3. */
  4. class ZerocopyFile {
  5. @SuppressWarnings("resource")
  6. public static void transferToDemo(String from, String to) throws IOException {
  7. FileChannel fromChannel = new RandomAccessFile(from, "rw").getChannel();
  8. FileChannel toChannel = new RandomAccessFile(to, "rw").getChannel();
  9.  
  10. long position = 0;
  11. long count = fromChannel.size();
  12.  
  13. fromChannel.transferTo(position, count, toChannel);
  14.  
  15. fromChannel.close();
  16. toChannel.close();
  17. }
  18.  
  19. @SuppressWarnings("resource")
  20. public static void transferFromDemo(String from, String to) throws IOException {
  21. FileChannel fromChannel = new FileInputStream(from).getChannel();
  22. FileChannel toChannel = new FileOutputStream(to).getChannel();
  23.  
  24. long position = 0;
  25. long count = fromChannel.size();
  26.  
  27. toChannel.transferFrom(fromChannel, position, count);
  28.  
  29. fromChannel.close();
  30. toChannel.close();
  31. }
  32.  
  33. public static void main(String[] args) throws IOException {
  34. String from = "src/main/java/zerocopy/1.data";
  35. String to = "src/main/java/zerocopy/2.data";
  36. // transferToDemo(from,to);
  37. transferFromDemo(from, to);
  38. }
  39. }

6、参考资料

https://my.oschina.net/cloudcoder/blog/299944

Java零拷贝的更多相关文章

  1. 零拷贝Zero copy-linux and java

    背景-几种拷贝方式 方式1:Copying in Two Sample System Calls read(file, tmp_buf, len); write(socket, tmp_buf, le ...

  2. 【Netty技术专题】「原理分析系列」Netty强大特性之ByteBuf零拷贝技术原理分析

    零拷贝Zero-Copy 我们先来看下它的定义: "Zero-copy" describes computer operations in which the CPU does n ...

  3. java的零拷贝机制

    转:https://blog.csdn.net/zhouhao88410234/article/details/77574689?fps=1&locationNum=9 为何要懂零拷贝原理?因 ...

  4. Java基础-零拷贝技术应用案例

    Java基础-零拷贝技术应用案例 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 零拷贝技术在Hadoop生态圈中很多组件得到应用,典型的比如kafka组件,它就很成功的应用了零拷贝 ...

  5. 零拷贝详解 Java NIO学习笔记四(零拷贝详解)

    转 https://blog.csdn.net/u013096088/article/details/79122671 Java NIO学习笔记四(零拷贝详解) 2018年01月21日 20:20:5 ...

  6. 零拷贝的原理及Java实现

    在谈论Kafka高性能时不得不提到零拷贝.Kafka通过采用零拷贝大大提供了应用性能,减少了内核和用户模式之间的上下文切换次数.那么什么是零拷贝,如何实现零拷贝呢? 什么是零拷贝 WIKI中对其有如下 ...

  7. java高并发实战Netty+协程(Fiber)|系列1|事件驱动模式和零拷贝

    今天开始写一些高并发实战系列. 本系列主要讲两大主流框架: Netty和Quasar(java纤程库) 先介绍netty吧,netty是业界比较成熟的高性能异步NIO框架. 简单来说,它就是对NIO2 ...

  8. Java后端进阶-网络编程(Netty零拷贝机制)

    package com.study.hc.net.netty.demo; import io.netty.buffer.ByteBuf; import io.netty.buffer.Unpooled ...

  9. 【Java】Java中的零拷贝

    物理内存 计算机物理内存条的容量,比如我们买电脑会关注内存大小有多少G,这个容量就是计算机的物理内存. 虚拟内存 操作系统为每个进程分配了独立的虚拟地址空间,也就是虚拟内存,虚拟地址空间又分为用户空间 ...

随机推荐

  1. ansible 批量推送公钥

    这里我们使用ansible的playbook 的功能来推送秘钥 使用方法参见:http://blog.csdn.net/magedu_linux/article/details/48529645 这里 ...

  2. php分享二十二:设计模式

    策略模式与观察者模式的区别: 策略是我现在方法有几个东西 我传入不同的参数就能拿到不同的东西,就像是spring中的populate,我传入不同的handler对象进来 返回的可以是javaBean或 ...

  3. 关于CALayer 中的contents(图片) 拉伸

    最近做有关 发送图片的功能.微信显示的图片 使用气泡遮罩出来的..而且图片尺寸也不止一种. 既然UIImagView 可以拉伸图片,设置遮罩的CALayer 的content 可不可以. 关键CALa ...

  4. 一个里表世界切换的shader效果

    之前GGJ实现了一个,但是实现方式上有很多冗余.今天正好在做一个类似的东西,重新做了一个版本 还是当时美术画的素材: 由于里表世界是不同的内容,是两张材质.所以拆分成不同Layer之后,里世界单独渲染 ...

  5. 顺时针旋转打印n阶矩阵(内测第0届第4题)

    题目要求 问题描述:顺时针旋转打印n阶矩阵 样例输入:4 1    2    3   4 12  13  14   5 11  16  15   6 10    9    8   7 样例输出:1 2 ...

  6. 深入理解Java中的逃逸分析

    在Java的编译体系中,一个Java的源代码文件变成计算机可执行的机器指令的过程中,需要经过两段编译,第一段是把.java文件转换成.class文件.第二段编译是把.class转换成机器指令的过程. ...

  7. .NET MVC结构框架下的微信扫码支付模式二 API接口开发测试

    直接上干货 ,我们的宗旨就是为人民服务.授人以鱼不如授人以渔.不吹毛求疵.不浮夸.不虚伪.不忽悠.一切都是为了社会共同进步,繁荣昌盛,小程序猿.大程序猿.老程序猿还是嫩程序猿,希望这个社会不要太急功近 ...

  8. 采用Oracle的dbms_obfuscation_toolkit的加密

    create or replace function MD5 (vpassword in varchar2) return varchar2 is retval varchar2(32); begin ...

  9. Recommender Systems中Yehuda Koren 和 Ma Hao的paper

    以前读了Yehuda Koren和Ma Hao的论文,感觉非常不错,这里分享一下.如果想着具体了解他们近期发的论文,可以去DBLP去看看. Yehuda Koren也是Netflix Prize的冠军 ...

  10. 【工具】Sublime + MarkdownEditing + OmniMarkupPreviewer使用起来

    Package Control的安装 下载安装Sublime Text3后,View -> Show Console调用Console. 在Console输入以下代码安装: import url ...