disruptor 高性能之道

disruptor是一个高性能的线程间异步通信的框架，即在同一个JVM进程中的多线程间消息传递。应用disruptor知名项目有如下的一些：Storm, Camel, Log4j2,还有目前的美团点评技术团队也有很多不少的应用，或者说有一些借鉴了它的设计机制。下面就跟着笔者一起去领略下disruptor高性能之道吧~

disruptor是一款开源的高性能队列框架，github地址为 https://github.com/LMAX-Exchange/disruptor。

分析disruptor，只要把event的生产和消费流程弄懂，基本上disruptor的七寸就已经抓住了。话不多说，赶紧上车，笔者以下面代码为例讲解disruptor：

public static void main(String[] args) {

    Disruptor<StringEvent> disruptor = new Disruptor<>(StringEvent::new, 1024,

            new PrefixThreadFactory("consumer-pool-", new AtomicInteger(0)), ProducerType.MULTI,

            new BlockingWaitStrategy());

    // 注册consumer并启动

    disruptor.handleEventsWith((EventHandler<StringEvent>) (event, sequence, endOfBatch) -> {

        System.out.println(Util.threadName() + "onEvent " + event);

    });

    disruptor.start();

    // publisher逻辑

    Executor executor = Executors.newFixedThreadPool(2,

            new PrefixThreadFactory("publisher-pool-", new AtomicInteger(0)));

    while (true) {

        for (int i = 0; i < 2; i++) {

            executor.execute(() -> {

                Util.sleep(1);

                disruptor.publishEvent((event, sequence, arg0) -> {

                    event.setValue(arg0 + " " + sequence);

                }, "hello world");

            });

        }

        Util.sleep(1000);

    }

}

class StringEvent {

    private String value;

    public String getValue() {

        return value;

    }

    public void setValue(String value) {

        this.value = value;

    }

    @Override

    public String toString() {

        return "StringEvent:{value=" + value + "}";

    }

}

class PrefixThreadFactory implements ThreadFactory {

    private String prefix;

    private AtomicInteger num;

    public PrefixThreadFactory(String prefix, AtomicInteger num) {

        this.prefix = prefix;

        this.num = num;

    }

    @Override

    public Thread newThread(Runnable r) {

        return new Thread(r, prefix + num.getAndIncrement());

    }

}

class Util {

    static String threadName() {

        return String.format("%-16s", Thread.currentThread().getName()) + ": ";

    }

    static void sleep(long millis) {

        try {

            Thread.sleep(millis);

        } catch (InterruptedException e) {

            e.printStackTrace();

        }

    }

}

测试相关类

event生产流程

event的生产是从 RingBuffer.publishEvent 开始的，event生产流程步骤如下：

获取待插入（到ringBuffer的）位置，相当于先占个位
往该位置上设置event
设置sequence对应event的标志，通知consumer

public <A> void publishEvent(EventTranslatorOneArg<E, A> translator, A arg0)

{

    // 获取当前要设置的sequence序号，然后进行设置并通知消费者

    final long sequence = sequencer.next();

    translateAndPublish(translator, sequence, arg0);

}

// 获取下一个sequence，直到获取到位置才返回

public long next(int n) {

    long current;

    long next;

    do {

        // 获取当前ringBuffer的可写入sequence

        current = cursor.get();

        next = current + n;

        long wrapPoint = next - bufferSize;

        long cachedGatingSequence = gatingSequenceCache.get();

        if (wrapPoint > cachedGatingSequence || cachedGatingSequence > current) {

            // 如果当前没有空位置写入，获取多个consumer中消费进度最小的那个的消费进度

            long gatingSequence = Util.getMinimumSequence(gatingSequences, current);

            if (wrapPoint > gatingSequence) {

                // 阻塞1ns，然后continue

                LockSupport.parkNanos(1); // TODO, should we spin based on the wait strategy?

                continue;

            }

            gatingSequenceCache.set(gatingSequence);

        }

        // cas设置ringBuffer的sequence

        else if (cursor.compareAndSet(current, next)) {

            break;

        }

    } while (true);

    return next;

}

private <A> void translateAndPublish(EventTranslatorOneArg<E, A> translator, long sequence, A arg0) {

    try {

        // 设置event

        translator.translateTo(get(sequence), sequence, arg0);

    } finally {

        sequencer.publish(sequence);

    }

}

public void publish(final long sequence) {

    // 1. 设置availableBuffer，表示对应的event是否设置完成，consumer线程中会用到

    //   - 注意，到这里时，event已经设置完成，但是consumer还不知道该sequence对应的event是否设置完成，

    //   - 所以需要设置availableBuffer中sequence对应event的sequence number

    // 2. 通知consumer

    setAvailable(sequence);

    waitStrategy.signalAllWhenBlocking();

}

从translateAndPublish中看，如果用户的设置event方法抛出异常，这时event对象是不完整的，那么publish到consumer端，consumer消费的不是完整的数据怎么办呢？在translateAndPublish中需不需要在异常情况下reset event对象呢？关于这个问题笔者之前是有疑问的，关于这个问题笔者提了一个issue，可点击 https://github.com/LMAX-Exchange/disruptor/issues/244 进行查看。

笔者建议在consumer消费完event之后，进行reset event操作，这样避免下次设置event异常consumer时取到不完整的数据，比如log4j2中的AsyncLogger中处理完log4jEvent之后就会调用clear方法进行重置event。

event消费流程

event消费流程入口是BatchEventProcessor.processEvents，event消费流程步骤：

获取当前consumer线程消费的offset，即nextSequence
从ringBuffer获取可用的sequence，没有新的event时，会根据consmer阻塞策略进行执行某些动作
获取event，然后执行event回调
设置当前consumer线程的消费进度

private void processEvents() {

    T event = null;

    long nextSequence = sequence.get() + 1L;

    while (true) {

        try {

            // 获取可用的sequence，默认直到有可用sequence时才返回

            final long availableSequence = sequenceBarrier.waitFor(nextSequence);

            if (batchStartAware != null) {

                batchStartAware.onBatchStart(availableSequence - nextSequence + 1);

            }

            // 执行消费回调动作，注意，这里获取到一个批次event，可能有多个，个数为availableSequence-nextSequence + 1

            // nextSequence == availableSequence表示该批次只有一个event

            while (nextSequence <= availableSequence) {

                // 获取nextSequence位置上的event

                event = dataProvider.get(nextSequence);

                // 用户自定义的event 回调

                eventHandler.onEvent(event, nextSequence, nextSequence == availableSequence);

                nextSequence++;

            }

            // 设置当前consumer线程的消费进度sequence

            sequence.set(availableSequence);

        } catch (final Throwable ex) {

            exceptionHandler.handleEventException(ex, nextSequence, event);

            sequence.set(nextSequence);

            nextSequence++;

        }

    }

}

public long waitFor(final long sequence)

        throws AlertException, InterruptedException, TimeoutException{

    long availableSequence = waitStrategy.waitFor(sequence, cursorSequence, dependentSequence, this);

    if (availableSequence < sequence) {

        return availableSequence;

    }

    // 获取ringBuffer中可安全读的最大的sequence number，该信息存在availableBuffer中的sequence

    // 在MultiProducerSequencer.publish方法中会设置

    return sequencer.getHighestPublishedSequence(sequence, availableSequence);

}

// 默认consumer阻塞策略 BlockingWaitStrategy

public long waitFor(long sequence, Sequence cursorSequence, Sequence dependentSequence, SequenceBarrier barrier)

    throws AlertException, InterruptedException

{

    long availableSequence;

    if (cursorSequence.get() < sequence) {

        // 当前ringBuffer的sequence小于sequence，阻塞等待

        // event生产之后会唤醒

        synchronized (mutex) {

            while (cursorSequence.get() < sequence) {

                barrier.checkAlert();

                mutex.wait();

            }

        }

    }

    while ((availableSequence = dependentSequence.get()) < sequence) {

        barrier.checkAlert();

        ThreadHints.onSpinWait();

    }

    return availableSequence;

}

从上面的event消费流程来看，消费线程会读取ringBuffer的sequence，然后更新本消费线程内的offset（消费进度sequence），如果有多个event的话，那么就是广播消费模式了（单consumer线程内还是顺序消费），如果不想让event被广播消费（重复消费），可使用如下方法添加consumer线程（WorkHandler是集群消费，EventHandler是广播消费）：

disruptor.handleEventsWithWorkerPool((WorkHandler<StringEvent>) event -> {

    System.out.println(Util.threadName() + "onEvent " + event);

});

disruptor高性能之道

弃用锁机制改用CAS

event生产流程中获取并自增sequence时用的就是CAS，获取之后该sequence对应位置的操作只会在单线程，没有了并发问题。

集群消费模式下获取sequence之后也会使用CAS设置为sequence新值，设置本地消费进度，然后再执行获取event并执行回调逻辑。

注意，disruptor中较多地方使用了CAS，但并不代表完全没有了锁机制，比如默认consumer阻塞策略 BlockingWaitStrategy发挥作用时，consumer消费线程就会阻塞，只不过这只会出现在event生产能力不足是才会存在。如果consumer消费不足，大量event生产导致ringBuffer爆满，这时event生产线程就会轮询调用LockSupport.parkNanos(1)，这里的成本也不容小觑（涉及到线程切换损耗）。

避免伪共享引入缓冲行填充

伪共享讲的是多个CPU时的123级缓存的问题，通常，缓存是以缓存行的方式读取数据，如果A、B两个变量被缓冲在同一行之内，那么对于其中一个的更新会导致另一个缓冲无效，需要从内存中读取，这种无法充分利用缓存行的问题就是伪共享。disruptor相关代码如下：

class LhsPadding {

    protected long p1, p2, p3, p4, p5, p6, p7;

}

class Value extends LhsPadding {

    protected volatile long value;

}

使用RingBuffer作为数据存储容器

ringBuffer是一个环形队列，本质是一个数组，size为2的幂次方（方便做&操作），数据位置sequence值会和size做&操作得出数组下标，然后进行数据的读写操作（只在同一个线程内，无并发问题）。

小结

disruptor初衷是为了解决内存队列的延迟问题，作为一个高性能队列，包括Apache Storm、Camel、Log4j 2在内的很多知名项目都在使用。disruptor的重要机制就是CAS和RingBuffer，借助于它们两个实现数据高效的生产和消费。

disruptor多生产者多消费者模式下，因为RingBuffer数据的写入是分为2步的（先获取到个sequence，然后写入数据），如果获取到sequence之后，生产者写入RingBuffer较慢，consumer消费较快，那么生产者最终会拖慢consumer消费进度，这一点需注意（如果已经消费到生产者占位的前一个数据了，那么consumer会执行对应的阻塞策略）。在实际使用过程中，如果consumer消费逻辑耗时较长，可以封装成任务交给线程池来处理，避免consumer端拖慢生成者的写入速度。

disruptor的设计对于开发者来说有哪些借鉴的呢？尽量减少竞争，避免多线程对同一数据做操作，比如disruptor使用CAS获取只会在一个线程内进行读写的event对象，这种思想其实已经在JDK的thread本地内存中有所体现；尽量复用对象，避免大量的内存申请释放，增加GC损耗，disruptor通过复用event对象来保证读写时不会产生对象GC问题；选择合适数据结构，disruptor使用ringBuffer，环形数组来实现数据高效读写。

参考资料：

1、https://tech.meituan.com/disruptor.html

disruptor 高性能之道的更多相关文章

Netty 系列之 Netty 高性能之道
1. 背景 1.1. 惊人的性能数据最近一个圈内朋友通过私信告诉我,通过使用 Netty4 + Thrift 压缩二进制编解码技术,他们实现了 10 W TPS(1 K 的复杂 POJO 对象)的跨 ...
Netty系列之Netty高性能之道
转载自http://www.infoq.com/cn/articles/netty-high-performance 1. 背景 1.1. 惊人的性能数据最近一个圈内朋友通过私信告诉我,通过使用Ne ...
Netty高性能之道
1. 背景 1.1. 惊人的性能数据最近一个圈内朋友告诉我,通过使用Netty4 + Thrift压缩二进制编解码技术,他们实现了10W TPS(1K的复杂POJO对象)的跨节点远程服务调用.相比于 ...
转：Netty系列之Netty高性能之道
1. 背景 1.1. 惊人的性能数据最近一个圈内朋友通过私信告诉我,通过使用Netty4 + Thrift压缩二进制编解码技术,他们实现了10W TPS(1K的复杂POJO对象)的跨节点远程服务调用 ...
【读后感】Netty 系列之 Netty 高性能之道 - 相比 Mina 怎样？
[读后感]Netty 系列之 Netty 高性能之道 - 相比 Mina 怎样 ? 太阳火神的漂亮人生 (http://blog.csdn.net/opengl_es) 本文遵循"署名-非商 ...
Netty 系列之 Netty 高性能之道高性能的三个主题 Netty使得开发者能够轻松地接受大量打开的套接字 Java 序列化
Netty系列之Netty高性能之道 https://www.infoq.cn/article/netty-high-performance 李林锋 2014 年 5 月 29 日话题:性能调优语言 ...
Disruptor 高性能并发框架二次封装
Disruptor是一款java高性能无锁并发处理框架.和JDK中的BlockingQueue有相似处,但是它的处理速度非常快!!!号称“一个线程一秒钟可以处理600W个订单”(反正渣渣电脑是没体会到 ...
Netty（五）Netty 高性能之道
4.背景介绍 4.1.1 Netty 惊人的性能数据通过使用 Netty(NIO 框架)相比于传统基于 Java 序列化+BIO(同步阻塞 IO)的通信框架,性能提升了 8 倍多.事实上,我对这个 ...
从构建分布式秒杀系统聊聊Disruptor高性能队列
前言秒杀架构持续优化中,基于自身认知不足之处在所难免,也请大家指正,共同进步.文章标题来自码友简介 LMAX Disruptor是一个高性能的线程间消息库.它源于LMAX对并发性,性能和非阻塞算法 ...

随机推荐

springboot 学习之路 1（简单入门）
目录:[持续更新.....] spring 部分常用注解 spring boot 学习之路1(简单入门) spring boot 学习之路2(注解介绍) spring boot 学习之路3( 集成my ...
Charles 抓包手机app
最近在测为移动端提供的API, 使用mac系统, 发现fiddler在mac下无法使用, 不知道其他朋友是否遇见过, 只能找替代工具. 先去百度上搜索下载Charles 破解版, 选择Charles是 ...
mac 全角/半角标点符号切换
快捷键:option+shift+H 背景是这样的,前段时间sublimeText新装了HTML/CSS/JS Prittify,JS代码格式化的快捷键是:command+shift+H. 记性有点差 ...
JMS Session session = connection.createSession(paramA,paramB) 两个参数不同组合下的含义和区别
Session session = connection.createSession(paramA,paramB); paramA是设置事务,paramB是设置acknowledgment mode ...
python爬虫之12306网站--火车票信息查询
python爬虫之12306网站--火车票信息查询思路: 1.火车票信息查询是基于车站信息查询,先完成车站信息查询,然后根据车站信息查询生成的url地址去查询当前已知出发站和目的站的所有车次车票信息 ...
PHP中生产不重复随机数的方法
PHP内置函数不重复随机数需求:要生成一个数组,这个数组里面有10个元素,都是整形,并且是1-60之间不重复的随机数. 代码: 代码示例: 1 2 3 4 5 6 7 8 9 10 ...
（转）Spring Boot (十三)： Spring Boot 小技巧
http://www.ityouknow.com/springboot/2017/06/22/spring-boot-tips.html 一些 Spring Boot 小技巧.小知识点初始化数据我 ...
设计模式のMementoPattern（备忘录模式）----行为模式
一.产生背景意图:在不破坏封装性的前提下,捕获一个对象的内部状态,并在该对象之外保存这个状态. 主要解决:所谓备忘录模式就是在不破坏封装的前提下,捕获一个对象的内部状态,并在该对象之外保存这个状态, ...
Linux 系统故障排查和修复技巧
Linux 系统故障排查和修复技巧我发现Linux系统在启动过程中会出现一些故障,导致系统无法正常启动,我在这里写了几个应用单用户模式.GRUB命令操作.Linux救援模式的故障修复案例帮助大家了解 ...
Java 8 新特性:5-Supplier、IntSupplier、BinaryOperator接口
(原) 这个接口很简单,里面只有一个抽象方法,没有default和静态方法. /* * Copyright (c) 2012, 2013, Oracle and/or its affiliates. ...