Netty之ByteBuf
本文内容主要参考<<Netty In Action>>,偏笔记向.
网络编程中,字节缓冲区是一个比较基本的组件.Java NIO提供了ByteBuffer
,但是使用过的都知道ByteBuffer
对于读写数据操作还是有些麻烦的,切换读写状态需要flip()
.Netty框架对字节缓冲区进行了封装,名称是ByteBuf
,相较于ByteBuffer
更灵活.
1.ByteBuf特点概览
- 用户可以自定义缓冲区类型对其扩展
- 通过内置的符合缓冲区类型实现了透明的零拷贝
- 容量可以按需增长(类似
StringBuilder
) - 切换读写模式不用调用
flip()
方法 - 读写使用各自的索引
- 支持方法的链式调用
- 支持引用计数
- 支持池化
2.ByteBuf类介绍
2.1工作模式
ByteBuf
维护了两个指针,一个用于读取(readerIndex
),一个用于写入(writerIndex
).
使用ByteBuf的API中的read*
方法读取数据时,readerIndex
会根据读取字节数向后移动,但是get*
方法不会移动readerIndex
;使用write*
数据时,writerIndex
会根据字节数移动,但是set*
方法不会移动writerIndex
.(read*
表示read
开头的方法,其余意义相同)
读取数据时,如果readerIndex
超过了writerIndex
会触发IndexOutOfBoundsException
.
可以指定ByteBuf
容量最大值,capacity(int)
或ensureWritable(int)
,当超出容量时会抛出异常.
2.2使用模式
2.2.1堆缓冲区
将ByteBuf
存入JVM的堆空间.能够在没有池化的情况下提供快速的分配和释放.
除此之外,ByteBuf的堆缓冲区还提供了一个后备数组(backing array).后备数组和ByteBuf中的数据是对应的,如果修改了backing array
中的数据,ByteBuf
中的数据是同步的.
public static void main(String[] args) {
ByteBuf heapBuf = Unpooled.buffer(1024);
if(heapBuf.hasArray()){
heapBuf.writeBytes("Hello,heapBuf".getBytes());
System.out.println("数组第一个字节在缓冲区中的偏移量:"+heapBuf.arrayOffset());
System.out.println("缓冲区中的readerIndex:"+heapBuf.readerIndex());
System.out.println("writerIndex:"+heapBuf.writerIndex());
System.out.println("缓冲区中的可读字节数:"+heapBuf.readableBytes());//等于writerIndex-readerIndex
byte[] array = heapBuf.array();
for(int i = 0;i < heapBuf.readableBytes();i++){
System.out.print((char) array[i]);
if(i==5){
array[i] = (int)'.';
}
}
//不会修改readerIndex位置
System.out.println("\n读取数据后的readerIndex:"+heapBuf.readerIndex());
//读取缓冲区的数据,查看是否将逗号改成了句号
while (heapBuf.isReadable()){
System.out.print((char) heapBuf.readByte());
}
}
输出:
数组第一个字节在缓冲区中的偏移量:0
缓冲区中的readerIndex:0
writerIndex:13
缓冲区中的可读字节数:13
Hello,heapBuf
读取数据后的readerIndex:0
Hello.heapBuf
如果
hasArray()
返回false
,尝试访问backing array会报错
2.2.2直接缓冲区
直接缓冲区存储于JVM堆外的内存空间.这样做有一个好处,当你想把JVM中的数据写给socket,需要将数据复制到直接缓冲区(JVM堆外内存)再交给socket.如果使用直接缓冲区,将减少复制这一过程.
但是直接缓冲区也是有不足的,与JVM堆的缓冲区相比,他们的分配和释放是比较昂贵的.而且还有一个缺点,面对遗留代码的时候,可能不确定ByteBuf使用的是直接缓冲区还是堆缓冲区,你可能需要进行一次额外的复制.如代码示例.
与自带后备数组的堆缓冲区来讲,这要多做一些工作.所以,如果确定容器中的数据会被作为数组来访问,你可能更愿意使用堆内存.
//实际上你不知道从哪获得的引用,这可能是一个直接缓冲区的ByteBuf
//忽略Unpooled.buffer方法,当做不知道从哪获得的directBuf
ByteBuf directBuf = Unpooled.buffer(1024);
//如果想要从数组中访问数据,需要将直接缓冲区中的数据手动复制到数组中
if (!directBuf.hasArray()) {
int length = directBuf.readableBytes();
byte[] array = new byte[length];
directBuf.getBytes(directBuf.readerIndex(), array);
handleArray(array, 0, length);
}
2.2.3符合缓冲区(CompositeByteBuf)
聚合缓冲区是个非常好用的东西,是多个ByteBuf的聚合视图,可以添加或删除ByteBuf实例.
CompositeByteBuf中的ByteBuf实例可能同事包含直接内存分配和非直接内存分配.如果其中只有一个实例,那么调用CompositeByteBuf中的
hasArray()
方法将返回该组件上的hasArray()
方法的值,否则返回false
多个ByteBuf组成一个完整的消息是很常见的,比如header
和body
组成的HTTP协议传输的消息.消息中的body
有时候可能能重用,我们不想每次都创建重复的body
,我们可以通过CompositeByteBuf来复用body
.
对比一下JDK中的ByteBuffer
实现复合缓冲区和Netty中的CompositeByteBuf
.
//JDK版本实现复合缓冲区
public static void byteBufferComposite(ByteBuffer header, ByteBuffer body) {
//使用一个数组来保存消息的各个部分
ByteBuffer[] message = new ByteBuffer[]{ header, body };
// 创建一个新的ByteBuffer来复制合并header和body
ByteBuffer message2 =
ByteBuffer.allocate(header.remaining() + body.remaining());
message2.put(header);
message2.put(body);
message2.flip();
}
//Netty中的CompositeByteBuf
public static void byteBufComposite() {
CompositeByteBuf messageBuf = Unpooled.compositeBuffer();
ByteBuf headerBuf = Unpooled.buffer(1024); // 可能是直接缓存也可能是堆缓存中的
ByteBuf bodyBuf = Unpooled.buffer(1024); // 可能是直接缓存也可能是堆缓存中的
messageBuf.addComponents(headerBuf, bodyBuf);
//...
messageBuf.removeComponent(0); // remove the header
for (ByteBuf buf : messageBuf) {
System.out.println(buf.toString());
}
}
CompositeByteBuf
不支持访问其后备数组,所以访问CompositeByteBuf
中的数据类似于访问直接缓冲区
CompositeByteBuf compBuf = Unpooled.compositeBuffer();
int length = compBuf.readableBytes();
byte[] array = new byte[length];
//将CompositeByteBuf中的数据复制到数组中
compBuf.getBytes(compBuf.readerIndex(), array);
//处理一下数组中的数据
handleArray(array, 0, array.length);
Netty使用CompositeByteBuf
来优化socket的IO操作,避免了JDK缓冲区实现所导致的性能和内存使用率的缺陷.内存使用率的缺陷是指对可复用对象大量的复制,Netty对其在内部做了优化,虽然没有暴露出来,但是应该知道CompositeByteBuf的优势和JDK自带工具的弊端.
JDK的NIO包中提供了Scatter/Gather I/O技术,字面意思是打散和聚合,可以理解为把单个ByteBuffer切分成多个或者把多个ByteBuffer合并成一个.
3.字节级操作
ByteBuf的索引从0开始,最后一个索引是capacity()-1
.
遍历演示
ByteBuf buffer = Unpooled.buffer(1024);
for (int i = 0; i < buffer.capacity(); i++) {
byte b = buffer.getByte(i);//这种方法不会移动readerIndex指针
System.out.println((char) b);
}
3.1readerIndex和writerIndex
JDK中的ByteBuffer
只有一个索引,需要通过flip()
来切换读写操作,Netty中的ByteBuf
既有读索引,也有写索引,通过两个索引把ByteBuf划分了三部分.
可以调用discardReadBytes()
方法可丢弃可丢弃字节并回收空间.
调用discardReadBytes()
方法之后
使用read*
或skip*
方法都会增加readerIndex
.
移动readerIndex
读取可读数据的方式
ByteBuf buffer = ...;
while (buffer.isReadable()) {
System.out.println(buffer.readByte());
}
write*
方法写入ByteBuf
时会增加writerIndex,如果超过容量会抛出IndexOutOfBoundException
.
writeableBytes()
可以返回可写字节数.
ByteBuf buffer = ...;
while (buffer.writableBytes() >= 4) {
buffer.writeInt(random.nextInt());
}
3.2索引管理
JDK 的
InputStream
定义了mark(int readlimit)
和reset()
方法,这些方法分别被用来将流中的当前位置标记为指定的值,以及将流重置到该位置。
同样,可以通过调用markReaderIndex()
、markWriterIndex()
、resetWriterIndex()
和resetReaderIndex()
来标记和重置ByteBuf
的readerIndex
和writerIndex
。这些和InputStream
上的调用类似,只是没有readlimit
参数来指定标记什么时候失效。
如果将索引设置到一个无效位置会抛出IndexOutOfBoundsException
.
可以通过clear()
归零索引,归零索引不会清除数据.
3.3查找
ByteBuf中很多方法可以确定值的索引,如indexOf()
.
复杂查找可以通过那些需要一个ByteBufProcessor
作为参数的方法完成.这个接口应该可以使用lambda
表达式(但是我现在使用的Netty4.1.12已经废弃了该接口,应该使用ByteProcessor
).
ByteBuf buffer = ...;
int index = buffer.forEachByte(ByteProcessor.FIND_CR);
3.4派生缓冲区
派生缓冲区就是,基于原缓冲区一顿操作生成新缓冲区.比如复制,切分等等.
duplicate()
;slice()
; slice(int, int)
;Unpooled.unmodifiableBuffer(…)
;order(ByteOrder)
; readSlice(int)
.
每个这些方法都将返回一个新的 ByteBuf 实例,它具有自己的读索引、写索引和标记
索引。 其内部存储和 JDK 的 ByteBuffer 一样也是共享的。这使得派生缓冲区的创建成本
是很低廉的,但是这也意味着,如果你修改了它的内容,也同时修改了其对应的源实例,所
以要小心
//复制
public static void byteBufCopy() {
Charset utf8 = Charset.forName("UTF-8");
ByteBuf buf = Unpooled.copiedBuffer("Netty in Action rocks!", utf8);
ByteBuf copy = buf.copy(0, 15);
System.out.println(copy.toString(utf8));
buf.setByte(0, (byte)'J');
assert buf.getByte(0) != copy.getByte(0);
}
//切片
public static void byteBufSlice() {
Charset utf8 = Charset.forName("UTF-8");
ByteBuf buf = Unpooled.copiedBuffer("Netty in Action rocks!", utf8);
ByteBuf sliced = buf.slice(0, 15);
System.out.println(sliced.toString(utf8));
buf.setByte(0, (byte)'J');
assert buf.getByte(0) == sliced.getByte(0);
}
还有一些读写操作的API,留在文末展示吧.
4.ByteBufHolder接口
我们经常发现, 除了实际的数据负载之外, 我们还需要存储各种属性值。 HTTP 响应便是一个很好的例子, 除了表示为字节的内容,还包括状态码、 cookie 等。
为了处理这种常见的用例, Netty 提供了 ByteBufHolder。 ByteBufHolder 也为 Netty 的高级特性提供了支持,如缓冲区池化,其中可以从池中借用 ByteBuf, 并且在需要时自动释放。ByteBufHolder 只有几种用于访问底层数据和引用计数的方法。
5.ByteBuf的分配
我们可以通过ByteBufAllocator
来分配一个ByteBuf
实例.ByteBufAllocator
接口实现了ByteBuf的池化.
可以通过 Channel
(每个都可以有一个不同的 ByteBufAllocator
实例)或者绑定到ChannelHandler
的 ChannelHandlerContext
获取一个到ByteBufAllocator
的引用。
//从Channel获取一个ByteBufAllocator的引用
Channel channel = ...;
ByteBufAllocator allocator = channel.alloc();
....
//从ChannelHandlerContext获取ByteBufAllocator 的引用
ChannelHandlerContext ctx = ...;
ByteBufAllocator allocator2 = ctx.alloc();
Netty提供了两种ByteBufAllocator的实现: PooledByteBufAllocator和UnpooledByteBufAllocator。前者池化了ByteBuf的实例以提高性能并最大限度地减少内存碎片。 后者的实现不 池化ByteBuf实例, 并且在每次它被调用时都会返回一个新的实例。
默认使用的是PooledByteBufAllocator
,可以通过ChannelConfig
修改.
Unpooled缓冲区
可能有时候拿不到ByteBufAllocator
引用的话,可以使用Unpooled工具类来创建未持化ByteBuf
实例.
ByteBufUtil类
ByteBufUtil 提供了用于操作 ByteBuf 的静态的辅助方法。因为这个 API 是通用的, 并且和池化无关,所以这些方法已然在分配类的外部实现。
这些静态方法中最有价值的可能就是 hexdump()方法, 它以十六进制的表示形式打印ByteBuf 的内容。这在各种情况下都很有用,例如, 出于调试的目的记录 ByteBuf 的内容。十六进制的表示通常会提供一个比字节值的直接表示形式更加有用的日志条目,此外,十六进制的版本还可以很容易地转换回实际的字节表示。
另一个有用的方法是 boolean equals(ByteBuf, ByteBuf), 它被用来判断两个 ByteBuf实例的相等性。如果你实现自己的 ByteBuf 子类,你可能会发现 ByteBufUtil 的其他有用方法。
6.引用计数
引用计数是一种通过在某个对象所持有的资源不再被其他对象引用时释放该对象所持有的资源来优化内存使用和性能的技术。 它们都实现了 interface ReferenceCounted。 引用计数背后的想法并不是特别的复杂;它主要涉及跟踪到某个特定对象的活动引用的数量。一个 ReferenceCounted 实现的实例将通常以活动的引用计数为 1 作为开始。只要引用计数大于 0, 就能保证对象不会被释放。当活动引用的数量减少到 0 时,该实例就会被释放。注意,虽然释放的确切语义可能是特定于实现的,但是至少已经释放的对象应该不可再用了。
//从Channel获取ByteBufAllocator
Channel channel = ...;
ByteBufAllocator allocator = channel.alloc();
....
//从ByteBufAllocator分配一个ByteBuf
ByteBuf buffer = allocator.directBuffer();
assert buffer.refCnt() == 1;//引用计数是否为1
7.API
ByteBuf
ByteBufAllocator
Unpooled
Netty之ByteBuf的更多相关文章
- 【Netty】Netty之ByteBuf
一.前言 前面已经学习了Netty中传输部分,现在接着学习Netty中的ByteBuf. 二.ByteBuf 2.1 ByteBuf API 在网络上传输的数据形式为Byte,Java NIO提供了B ...
- Netty中ByteBuf的引用计数线程安全的实现原理
原文链接 Netty中ByteBuf的引用计数线程安全的实现原理 代码仓库地址 ByteBuf 实现了ReferenceCounted 接口,实现了引用计数接口,该接口的retain(int) 方法为 ...
- Netty的ByteBuf
https://blog.csdn.net/thinking_fioa/article/details/80795673 netty的ByteBuf知识点
- java.neo的ByteBuffer与Netty 的ByteBuf
JDK的ByteBuffer的缺点: 1.final byte[] hb;这是JDKde ByteBuffer对象中用于存储数据的对象声明;可以看到,其字节数组是被声明为final的,也就是长度是固定 ...
- Netty笔记--ByteBuf释放
参考资料:http://www.maljob.com/pages/newsDetail.html?id=394 参考资料:http://www.blogjava.net/liuguly/archive ...
- Netty中ByteBuf 的零拷贝
转载:https://www.jianshu.com/p/1d1fa2fe1ed9 此文章已同步发布在我的 segmentfault 专栏. 根据 Wiki 对 Zero-copy 的定义: &quo ...
- Netty Associated -- ByteBuf
ByteBuf ByteBuf是Netty的Server与Client之间通信的数据传输载体.他提供了一个byte数组(byte[])的抽象视图 buffer创建 我们推荐通过一个Unpooled的帮 ...
- netty LEAK: ByteBuf.release() was not called before it's garbage-collected
背景.netty抛出完整的error信息如下: 2018-02-08 14:30:43.098 [nioEventLoopGroup-5-1] ERROR io.netty.util.Resource ...
- netty之ByteBuf详解
[ChannelPromise作用:可以设置success或failure 是为了通知ChannelFutureListener]Netty的数据处理API通过两个组件暴露——abstract cla ...
随机推荐
- popStar机机对战数据生成器代码(C#)
代码: using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; ...
- cf Inverse the Problem (最小生成树+DFS)
题意: N个点.N行N列d[i][j]. d[i][j]:结点i到结点j的距离. 问这N个点是否可能是一棵树.是输出YES,否则输出NO. 思路: 假设这个完全图是由一棵树得来的,则我们对这个完全图求 ...
- 我的笔记本电脑瞬间扩大一个T的容量!
前言 不知道有多少人在家里搭建中央存储设备的,也就是NAS.这个东西在我日常生活中,存储了大量的个人资料,家人们的照片,技术的资料,还有各种高清影视剧.搭配公网的IP,可以真正做到,任何时候任何地点的 ...
- RabbitMQ多消费者顺序性消费消息实现
最近起了个项目消息中心,用来中转各个系统中产生的消息,用到的是RabbitMQ,由于UAT环境.生产环境每台消费者服务都是多台,有些消息要求按顺序消费,所以需要采取一定的措施保证消息的顺序消费,下面讲 ...
- C语言图书管理借阅系统——ncurses库的使用
一.前言 作为一只大四狗,最近还跟着大二同学修了一门课(当然不是之前没通过啦),课程是高级语言课程设计,高级语言指的是C语言 :),内容是做一个XX管理系统,我选择了图书管理系统,先介绍下我做的系统: ...
- (2)Canal管理后台在linux环境上部署
1.背景 canal-admin设计为canal组件提供了配置管理.节点运维等功能的WebUI操作界面,方便用户快速操作. 2.前期准备 先到官网下载个canal.admin组件:也可以输入命令下载: ...
- 【JAVA】笔记(3)---封装;如何选择声明静态变量还是实例变量;如何选择声明静态方法还是实例方法;静态代码块与实例代码块的执行顺序与用途;
封装: 1.目的:保证对象中的实例变量无法随意修改/访问,只能通过我们自己设定的入口,出口(set / get)来间接操作:屏蔽类中复杂的结构,使我们程序员在主方法中关联对象写代码时,思路/代码格式更 ...
- liunx基础知识点2:文件操作命令、系统资源查询、权限赋予命令、安装命令、解压命令
- cmd 命令 导出导入oracle数据库 的 表
原地址:https://www.cnblogs.com/mysterious-killer/p/11671741.html (防止) 导出: 不要数据的:exp username/pwd@localh ...
- java-TCP协议发送和接收数据
TCP协议接收数据的步骤: A:创建接收数据的Socket对象 创建对象的时候要指定端口 B:监听客户端连接 等待客户端连接 C:获取Socket对象的输入流(字节流) D:读数据,并显示在控制台 E ...