简介
netty中的内置编码器
使用codec要注意的问题
netty内置的基本codec
- base64
- bytes
- compression
- json
- marshalling
- protobuf
- serialization
- string
- xml
总结

简介

netty之所以强大，是因为它内置了很多非常有用的编码解码器，通过使用这些编码解码器可以很方便的搭建出非常强大的应用程序，今天给大家讲讲netty中最基本的内置编码解码器。

netty中的内置编码器

在对netty的包进行引入的时候，我们可以看到netty有很多以netty-codec开头的artifactId，统计一下，有这么多个：

netty-codec

netty-codec-http

netty-codec-http2

netty-codec-memcache

netty-codec-redis

netty-codec-socks

netty-codec-stomp

netty-codec-mqtt

netty-codec-haproxy

netty-codec-dns

总共10个codec包，其中netty-codec是最基础的一个，其他的9个是对不同的协议包进行的扩展和适配，可以看到netty支持常用的和流行的协议格式，非常的强大。因为codec的内容非常多，要讲解他们也不是很容易，本文将会以netty-codec做一个例子，讲解其中最基本的也是最通用的编码解码器。

使用codec要注意的问题

虽然netty提供了很方便的codec编码解码器，但是正如我们在前一篇文章中提到的，有些codec是需要和Frame detection一起配合使用的，先使用Frame detection将ByteBuf拆分成一个个代表真实数据的ByteBuf，再交由netty内置的codec或者自定义的codec进行处理，这样才能起到应有的效果。

netty内置的基本codec

netty中基本的codec有base64、bytes、compression、json、marshalling、protobuf、serialization、string和xml这几种。

下面将会一一进行讲解。

base64

这个codec是负责ByteBuf和base64过后的ByteBuf之间的转换。虽然都是从ByteBuf到ByteBuf，但是其中的内容发生了变化。

有两个关键的类，分别是Base64Encoder和Base64Decoder。因为Base64Decoder是一个MessageToMessageDecoder，所以需要使用一个DelimiterBasedFrameDecoder提前进行处理，常用的例子如下：

   ChannelPipeline pipeline = ...;

   // Decoders

   pipeline.addLast("frameDecoder", new DelimiterBasedFrameDecoder(80, Delimiters.nulDelimiter()));

   pipeline.addLast("base64Decoder", new Base64Decoder());

   // Encoder

   pipeline.addLast("base64Encoder", new Base64Encoder());

bytes

bytes是将bytes数组和ByteBuf之间进行转换，同样的在decode之前，也需要使用FrameDecoder，通常的使用方式如下：

   ChannelPipeline pipeline = ...;

   // Decoders

   pipeline.addLast("frameDecoder",

                    new LengthFieldBasedFrameDecoder(1048576, 0, 4, 0, 4));

   pipeline.addLast("bytesDecoder",

                    new ByteArrayDecoder());

   // Encoder

   pipeline.addLast("frameEncoder", new LengthFieldPrepender(4));

   pipeline.addLast("bytesEncoder", new ByteArrayEncoder());

compression

compression这个包的内容就比较丰富了，主要是对数据的压缩和解压缩服务。其支持的算法如下：

brotli

Bzip2

FastLZ

JdkZlib

Lz4

Lzf

Snappy

Zlib

Zstandard

compression对于大数据量的传输特别有帮助，通过压缩可以节省传输的数据量，从而提高传输速度。

但是压缩是使用特定的算法来计算的，所以它是一个高CPU的操作，我们在使用的时候需要兼顾网络速度和CPU性能，并从中得到平衡。

json

json这个包里面只有一个JsonObjectDecoder类，主要负责将Byte流的JSON对象或者数组转换成JSON对象和数组。

JsonObjectDecoder直接就是一个ByteToMessageDecoder的子类，所以它不需要FrameDecoder，它是根据括号的匹配来判断Byte数组的起始位置，从而区分哪些Byte数据是属于同一个Json对象或者数组。

我们如果希望使用JSON来传输数据的话，这个类就非常有用了。

marshalling

Marshalling的全称叫做JBoss Marshalling，它是JBoss出品的一个对象序列化的方式，但是JBoss Marshalling的最新API还是在2011-04-27，已经有10年没更新了，是不是已经被废弃了？

所以这里我们不详细介绍这个序列化的内容，感兴趣的小伙伴可以自行探索。

protobuf

protobuf大家应该都很熟悉了，它是google出品的一种信息交换格式，可以将其看做是一种序列化的方式。它是语言中立、平台中立、可扩展的结构化数据序列化机制，和XML类似，但是比XML更小、更快、更简单。

netty对protobuf的支持在于可以将protobuf中的message和MessageLite对象跟ByteBuf进行转换。

protobuf的两个编码器也是message到message直接的转换，所以也需要使用frame detection。当然你也可以使用其他的frame detection比如LengthFieldPrepender和LengthFieldBasedFrameDecoder如下所示：

   ChannelPipeline pipeline = ...;

   // Decoders

   pipeline.addLast("frameDecoder",

                    new LengthFieldBasedFrameDecoder(1048576, 0, 4, 0, 4));

   pipeline.addLast("protobufDecoder",

                    new ProtobufDecoder(MyMessage.getDefaultInstance()));

   // Encoder

   pipeline.addLast("frameEncoder", new LengthFieldPrepender(4));

   pipeline.addLast("protobufEncoder", new ProtobufEncoder());

其中LengthFieldPrepender会自动给字段前面加上一个长度字段：

之前：

   +----------------+

   | "HELLO, WORLD" |

   +----------------+

之后：

   +--------+----------------+

   + 0x000C | "HELLO, WORLD" |

   +--------+----------------+

当然netty为protobuf准备了两个专门的frame detection，他们是ProtobufVarint32FrameDecoder和ProtobufVarint32LengthFieldPrepender。在讲解这两个类之前，我们需要了解一下protobuf中的Base 128 Varints。

什么叫Varints呢？就是序列化整数的时候，占用的空间大小是不一样的，小的整数占用的空间小，大的整数占用的空间大，这样不用固定一个具体的长度，可以减少数据的长度，但是会带来解析的复杂度。

那么怎么知道这个数据到底需要几个byte呢？在protobuf中，每个byte的最高位是一个判断位，如果这个位被置位1，则表示后面一个byte和该byte是一起的，表示同一个数，如果这个位被置位0，则表示后面一个byte和该byte没有关系，数据到这个byte就结束了。

举个例子，一个byte是8位，如果表示的是整数1，那么可以用下面的byte来表示：

0000 0001

如果一个byte装不下的整数，那么就需要使用多个byte来进行连接操作，比如下面的数据表示的是300：

1010 1100 0000 0010

为什么是300呢？首先看第一个byte，它的首位是1，表示后面还有一个byte。再看第二个byte，它的首位是0，表示到此就结束了。我们把判断位去掉，变成下面的数字：

010 1100 000 0010

这时候还不能计算数据的值，因为在protobuf中，byte的位数是反过来的，所以我们需要把上面的两个byte交换一下位置：

000 0010 010 1100

也就是：

10 010 1100

=256 + 32 + 8 + 4 = 300

在protobuf中一般使用Varint作为字段的长度位，所以netty提供了ProtobufVarint32LengthFieldPrepender和ProtobufVarint32FrameDecoder对ByteBuf进行转换。

比如为ByteBuf添加varint的length：

   BEFORE ENCODE (300 bytes)       AFTER ENCODE (302 bytes)

   +---------------+               +--------+---------------+

   | Protobuf Data |-------------->| Length | Protobuf Data |

   |  (300 bytes)  |               | 0xAC02 |  (300 bytes)  |

   +---------------+               +--------+---------------+

解码的时候删除varint的length字段：

   BEFORE DECODE (302 bytes)       AFTER DECODE (300 bytes)

   +--------+---------------+      +---------------+

   | Length | Protobuf Data |----->| Protobuf Data |

   | 0xAC02 |  (300 bytes)  |      |  (300 bytes)  |

   +--------+---------------+      +---------------+

serialization

序列化就是把对象转换成二进制数据，事实上所有的codec都可以成为序列化。他们提供了对象和byte之间的转换方法。

netty也提供了两个对象的转换方法：ObjectDecoder和ObjectEncoder。

要注意的是，这两个对象和JDK自带的ObjectInputStream和ObjectOutputStream，是不兼容的，如果要兼容，可以使用CompactObjectInputStream、CompactObjectOutputStream和CompatibleObjectEncoder。

string

String是我们最常使用到的对象，netty为string提供了StringDecoder和StringEncoder。

同样的，在使用这两个类之前，需要将消息进行转换，通常使用的是 LineBasedFrameDecoder按行进行转换：

   ChannelPipeline pipeline = ...;

   // Decoders

   pipeline.addLast("frameDecoder", new LineBasedFrameDecoder(80));

   pipeline.addLast("stringDecoder", new StringDecoder(CharsetUtil.UTF_8));

   // Encoder

   pipeline.addLast("stringEncoder", new StringEncoder(CharsetUtil.UTF_8));

xml

xml也是一个非常常用的格式，但是它的体积会比较大，现在应该用的比较少了。netty提供了一个XmlFrameDecoder来进行解析。

因为xml有自己的开始和结束符，所以不需要再做frame detection，直接转换即可，如：

   +-----+-----+-----------+

   | <an | Xml | Element/> |

   +-----+-----+-----------+

转换成：

   +-----------------+

   | <anXmlElement/> |

   +-----------------+

   +-----+-----+-----------+-----+----------------------------------+

   | <an | Xml | Element/> | <ro | ot><child>content</child></root> |

   +-----+-----+-----------+-----+----------------------------------+

   转换成：

   +-----------------+-------------------------------------+

   | <anXmlElement/> | <root><child>content</child></root> |

   +-----------------+-------------------------------------+

都是可以的。

总结

netty提供了很多优秀的codec来适配各种应用协议，大家可以多用用，找找不同协议的不同之处。

本文已收录于 http://www.flydean.com/16-netty-buildin-codec-common/

最通俗的解读，最深刻的干货，最简洁的教程，众多你不知道的小技巧等你来发现！

欢迎关注我的公众号:「程序那些事」,懂技术，更懂你！

netty系列之:netty中的懒人编码解码器的更多相关文章

【读后感】Netty 系列之 Netty 高性能之道 - 相比 Mina 怎样？
[读后感]Netty 系列之 Netty 高性能之道 - 相比 Mina 怎样 ? 太阳火神的漂亮人生 (http://blog.csdn.net/opengl_es) 本文遵循"署名-非商 ...
Netty 系列之 Netty 高性能之道高性能的三个主题 Netty使得开发者能够轻松地接受大量打开的套接字 Java 序列化
Netty系列之Netty高性能之道 https://www.infoq.cn/article/netty-high-performance 李林锋 2014 年 5 月 29 日话题:性能调优语言 ...
netty系列之:netty实现http2中的流控制
目录简介 http2中的流控制 netty对http2流控制的封装 Http2FlowController Http2LocalFlowController Http2RemoteFlowContr ...
netty系列之:netty中各不同种类的channel详解
目录简介 ServerChannel和它的类型 Epoll和Kqueue AbstractServerChannel ServerSocketChannel ServerDomainSocketCh ...
netty系列之:netty中的核心编码器bytes数组
目录简介 byte是什么 netty中的byte数组的工具类 netty中byte的编码器总结简介我们知道netty中数据传输的核心是ByteBuf,ByteBuf提供了多种数据读写的方法,包 ...
netty系列之:netty中常用的字符串编码解码器
目录简介 netty中的字符串编码解码器不同平台的换行符字符串编码的实现总结简介字符串是我们程序中最常用到的消息格式,也是最简单的消息格式,但是正因为字符串string太过简单,不能附加更 ...
netty系列之:netty架构概述
目录简介 netty架构图丰富的Buffer数据机构零拷贝统一的API 事件驱动其他优秀的特性总结简介 Netty为什么这么优秀,它在JDK本身的NIO基础上又做了什么改进呢?它的架构和 ...
Netty 系列之 Netty 高性能之道
1. 背景 1.1. 惊人的性能数据最近一个圈内朋友通过私信告诉我,通过使用 Netty4 + Thrift 压缩二进制编解码技术,他们实现了 10 W TPS(1 K 的复杂 POJO 对象)的跨 ...
Netty系列之Netty高性能之道
转载自http://www.infoq.com/cn/articles/netty-high-performance 1. 背景 1.1. 惊人的性能数据最近一个圈内朋友通过私信告诉我,通过使用Ne ...

随机推荐

Hadoop：Hadoop的安装
CentOS7安装Hadoop需要有JDK,所以先下载安装JDK后,在进行安装Hadoop 下载Hadoop #联网状态下使用wget命令 wget http://archive.apache.org ...
inux下查看最消耗CPU、内存的进程
1.CPU占用最多的前10个进程: ps auxw|head -1;ps auxw|sort -rn -k3|head -10 2.内存消耗最多的前10个进程 ps auxw|head -1;ps a ...
Java初级面试题整理
先看再点赞,给自己一点思考的时间,如果对自己有帮助,微信搜索[程序职场]关注这个执着的职场程序员. 我有什么:职场规划指导,技能提升方法,讲不完的职场故事,个人成长经验. 1. Java语言有哪些特点 ...
DRF之JWT认证
一.JWT认证 JWT构成 JWT分为三段式:头.体.签名(head.payload.sgin) 头和体是可逆加密的,让服务器可以反解析出user对象,签名是不可逆加密,保证整个token的安全性的. ...
为什么使用 LSTM 训练速度远大于 SimpleRNN？
今天试验 TensorFlow 2.x , Keras 的 SimpleRNN 和 LSTM,发现同样的输入.同样的超参数设置.同样的参数规模,LSTM 的训练时长竟然远少于 SimpleRNN. 模 ...
谷粒商城--分布式基础篇（P1~P27）
谷粒商城--分布式基础篇P1~P27 去年3月份谷粒商城分布式基础.进阶.高级刚出的时候就开始学了,但是中途因为一些事就中断了,结果一直到现在才有时间重新开始学,看到现在网上这么多人都学完了,确实感觉 ...
让5G技术“智慧”生活
1.通讯技术的发展历程 2.5G技术的指标和具体概述 3. 5G的三个关键技术及概述 4.5G的应用场景及业务及安全挑战如果你认为5G带来的只是下载视频 ...
python mysql类
import pymysql class MysqlHelper(object): conn = None def __init__(self, host, username, password, d ...
Window安装构建神器Jenkins
Jenkins是什么? Jenkins是一款开源 CI&CD 软件,用于自动化各种任务,包括构建.测试和部署软件.支持各种运行方式,可通过系统包.Docker 或者通过一个独立的 Java 程 ...
Nginx反向代理访问内网服务器
Nginx反向代理访问内网服务器问题描述公司给配的台式机太垃圾了,不能访问外部网络就算了,还没有maven私服.近期项目不光得使用maven还得使用内网中的数据库之类,台式机太卡只能用自己的笔 ...

netty系列之:netty中的懒人编码解码器

简介