在日常的开发中,Android 的消息机制作为系统运行的根本机制之一,显得十分的重要。 
从 Handler 发送消息开始

查看源码,Handler的post、send方法最终都会走到

  1. public final boolean sendMessageDelayed(Message msg, long delayMillis) {
  2. if (delayMillis < 0) {
  3. delayMillis = 0;
  4. }
  5. return sendMessageAtTime(msg, SystemClock.uptimeMillis() + delayMillis);
  6. }

sendMessageDelayed 会走到

  1. private boolean enqueueMessage(MessageQueue queue, Message msg, long uptimeMillis) {
  2. msg.target = this;
  3. if (mAsynchronous) {
  4. msg.setAsynchronous(true);
  5. }
  6. return queue.enqueueMessage(msg, uptimeMillis);
  7. }

这里可以设置 Message 为异步消息

查看 queue 的 enqueueMessage 方法, 我们剥离出核心代码:

  1. if (p == null || when == 0 || when < p.when) {
  2. // New head, wake up the event queue if blocked.
  3. msg.next = p;
  4. mMessages = msg;
  5. needWake = mBlocked;
  6. }

如果是新的队列头,直接插入队列

如果队列里面已经有消息了,执行如下逻辑

  1. needWake = mBlocked && p.target == null && msg.isAsynchronous();
  2. Message prev;
  3. for (;;) {
  4. prev = p;
  5. p = p.next;
  6. if (p == null || when < p.when) {
  7. break;
  8. }
  9. if (needWake && p.isAsynchronous()) {
  10. needWake = false;
  11. }
  12. }
  13. msg.next = p; // invariant: p == prev.next
  14. prev.next = msg;

插入消息的时候,一般不会唤醒消息队列。如果消息是异步的,并且队列头不是一个异步消息的时候,会唤醒消息队列

  1. if (needWake) {
  2. nativeWake(mPtr);
  3. }

消息队列的具体唤醒过程我们暂时不细看。把关注点移到 Looper 上。looper在执行的时候具体执行了什么逻辑呢?查看 Looper.java 的 looper() 方法

looper 方法中有一个死循环, 在死循环中,会获取下一个 Message

  1. for (;;) {
  2. Message msg = queue.next(); // might block
  3. }
  1. if (msg != null && msg.target == null) {
  2. // Stalled by a barrier.  Find the next asynchronous message in the queue.
  3. do {
  4. prevMsg = msg;
  5. msg = msg.next;
  6. } while (msg != null && !msg.isAsynchronous());

当存在一个 barrier 消息的时候,会寻找队列中下一个异步任务。而不是按照顺序。 例如3个消息,1,2,3, 2 是异步消息。如果不存在barrier的时候,next的顺序就是 1,2,3 但是如果存在barrier的时候,则是 2,1,3

  1. if (msg != null) {
  2. if (now < msg.when) {
  3. // Next message is not ready.  Set a timeout to wake up when it is ready.
  4. nextPollTimeoutMillis = (int) Math.min(msg.when - now, Integer.MAX_VALUE);
  5. } else {
  6. // Got a message.
  7. mBlocked = false;
  8. if (prevMsg != null) {
  9. prevMsg.next = msg.next;
  10. } else {
  11. mMessages = msg.next;
  12. }
  13. msg.next = null;
  14. if (DEBUG) Log.v(TAG, "Returning message: " + msg);
  15. msg.markInUse();
  16. return msg;
  17. }
  18. } else {
  19. // No more messages.
  20. nextPollTimeoutMillis = -1;
  21. }

这里如果 next 的 Message 不为空,就返回,并且将它移出队列 在 MessageQueue 为空的时候,会顺便去处理一下 add 过的 IdleHandler, 处理一些不重要的消息

  1. for (int i = 0; i < pendingIdleHandlerCount; i++) {
  2. final IdleHandler idler = mPendingIdleHandlers[i];
  3. mPendingIdleHandlers[i] = null; // release the reference to the handler
  4. boolean keep = false;
  5. try {
  6. keep = idler.queueIdle();
  7. } catch (Throwable t) {
  8. Log.wtf(TAG, "IdleHandler threw exception", t);
  9. }
  10. if (!keep) {
  11. synchronized (this) {
  12. mIdleHandlers.remove(idler);
  13. }
  14. }

查看 IdleHandler 的源码。

  1. * Callback interface for discovering when a thread is going to block
  2. * waiting for more messages.
  3. */
  4. public static interface IdleHandler {
  5. /**
  6. * Called when the message queue has run out of messages and will now
  7. * wait for more.  Return true to keep your idle handler active, false
  8. * to have it removed.  This may be called if there are still messages
  9. * pending in the queue, but they are all scheduled to be dispatched
  10. * after the current time.
  11. */
  12. boolean queueIdle();
  13. }

当 queueIdle() 为 false 的时候,会将它从 mIdleHandlers 中 remove,仔细思考下,我们其实可以利用IdleHandler实现不少功能, 例如

  1. Looper.myQueue().addIdleHandler(new MessageQueue.IdleHandler() {
  2. @Override
  3. public boolean queueIdle() {
  4. return false
  5. }
  6. });

我们可以在 queueIdle 中,趁着没有消息要处理,统计一下页面的渲染时间(消息发送完了说明UI已经渲染完了),或者算一下屏幕是否长时间没操作等等。

拿到 Message 对象后,会将 Message 分发到对应的 target 去

  1. msg.target.dispatchMessage(msg);

查看源码

  1. public void dispatchMessage(Message msg) {
  2. if (msg.callback != null) {
  3. handleCallback(msg);
  4. } else {
  5. if (mCallback != null) {
  6. if (mCallback.handleMessage(msg)) {
  7. return;
  8. }
  9. }
  10. handleMessage(msg);
  11. }
  12. }

当 msg 的 callback 不为 null 的时候,即通过 post(Runnable) 发送信息的会执行 handlerCallback(msg) 方法。如果 mCallback 不为 null并且 handleMessage 的结果为 false,则执行 handleMessage 方法。否则会停止分发。

  1. private static void handleCallback(Message message) {
  2. message.callback.run();
  3. }

查看 handlerCallback 方法源码, callback 会得到执行。到这里基本的Android消息机制就分析完了,简而言之就是,Handler 不断的将Message发送到一 根据时间进行排序的优先队列里面,而线程中的 Looper 则不停的从MQ里面取出消息,分发到相应的目标Handler执行。

为什么主线程不卡?

分析完基本的消息机制,既然 Looper 的 looper 方法是一个for(;;;)循环,那么新的问题提出来了。为什么Android会在主线程使用死循环?执行死循环的时候为什么主线程的阻塞没有导致CPU占用的暴增?�

继续分析在源码中我们没有分析的部分:

  • 消息队列构造的时候是否调用了jni部分
  • nativeWake、nativePollOnce这些方法的作用是什么

先查看MQ的构造方法:

  1. MessageQueue(boolean quitAllowed) {
  2. mQuitAllowed = quitAllowed;
  3. mPtr = nativeInit();
  4. }

会发现消息队列还是和native层有关系,继续查看android/platform/frameworks/base/core/jni/android_os_MessageQueue_nativeInit.cpp中nativeInit的实现:

  1. static jlong android_os_MessageQueue_nativeInit(JNIEnv* env, jclass clazz) {
  2. NativeMessageQueue* nativeMessageQueue = new NativeMessageQueue();
  3. if (!nativeMessageQueue) {
  4. jniThrowRuntimeException(env, "Unable to allocate native queue");
  5. return 0;
  6. }
  7. nativeMessageQueue->incStrong(env);
  8. return reinterpret_cast<jlong>(nativeMessageQueue);
  9. }

这里会发现我们初始化了一个 NativeMessageQueue ,查看这个消息队列的构造函数

  1. NativeMessageQueue::NativeMessageQueue() :
  2. mPollEnv(NULL), mPollObj(NULL), mExceptionObj(NULL) {
  3. mLooper = Looper::getForThread();
  4. if (mLooper == NULL) {
  5. mLooper = new Looper(false);
  6. Looper::setForThread(mLooper);
  7. }
  8. }

这里会发现在mq中初始化了 native 的 Looper 对象,查看android/platform/framework/native/libs/utils/Looper.cpp中 Looper 对象的构造函数

  1. // 简化后的代码
  2. Looper::Looper(bool allowNonCallbacks) :
  3. mAllowNonCallbacks(allowNonCallbacks), mSendingMessage(false),
  4. mResponseIndex(0), mNextMessageUptime(LLONG_MAX) {
  5. int wakeFds[2];
  6. int result = pipe(wakeFds);
  7. mWakeReadPipeFd = wakeFds[0];
  8. mWakeWritePipeFd = wakeFds[1];
  9. result = fcntl(mWakeReadPipeFd, F_SETFL, O_NONBLOCK);
  10. result = fcntl(mWakeWritePipeFd, F_SETFL, O_NONBLOCK);
  11. mEpollFd = epoll_create(EPOLL_SIZE_HINT);
  12. struct epoll_event eventItem;
  13. memset(& eventItem, 0, sizeof(epoll_event));
  14. eventItem.events = EPOLLIN;
  15. eventItem.data.fd = mWakeReadPipeFd;
  16. result = epoll_ctl(mEpollFd, EPOLL_CTL_ADD, mWakeReadPipeFd, & eventItem);
  17. }

这里我们会发现,在 native 层创建了一个epoll,并且对 epoll 的 event 事件进行了监听。

什么是epoll

在继续分析源码之前,我们先分析一下,什么是epoll

epoll是Linux中的一种IO多路复用方式,也叫做event-driver-IO。

Linux的select 多路复用IO通过一个select()调用来监视文件描述符的数组,然后轮询这个数组。如果有IO事件,就进行处理。

select的一个缺点在于单个进程能够监视的文件描述符的数量存在最大限制,select()所维护的存储大量文件描述符的数据结构,随着文件描述符数量的增大,其复制的开销也线性增长。

epoll在select的基础上(实际是在poll的基础上)做了改进,epoll同样只告知那些就绪的文件描述符,而且当我们调用epoll_wait()获得就绪文件描述符时,返回的不是实际的描述符,而是一个代表就绪描述符数量的值,你只需要去epoll指定的一个数组中依次取得相应数量的文件描述符即可。

另一个本质的改进在于epoll采用基于事件的就绪通知方式(设置回调)。在select中,进程只有在调用一定的方法后,内核才对所有监视的文件描述符进行扫描,而epoll事先通过epoll_ctl()来注册一个文件描述符,一旦基于某个文件描述符就绪时,内核会采用类似callback的回调机制,迅速激活这个文件描述符,当进程调用epoll_wait()时便得到通知

关于epoll和select,可以举一个例子来表达意思。select的情况和班长告诉全班同学交作业类似,会挨个去询问作业是否完成,如果没有完成,班长会继续询问。

而epoll的情况则是班长询问的时候只是统计了待交作业的人数,然后告诉同学作业完成的时候告诉把作业放在某处,然后喊一下他。然后班长每次都去这个地方收作业。

大致了解了epoll之后,我们继续查看nativePollOnce方法,同理,会调用native Looper的pollOnce方法

  1. while (mResponseIndex < mResponses.size()) {
  2. const Response& response = mResponses.itemAt(mResponseIndex++);
  3. int ident = response.request.ident;
  4. if (ident >= 0) {
  5. int fd = response.request.fd;
  6. int events = response.events;
  7. void* data = response.request.data;
  8. if (outFd != NULL) *outFd = fd;
  9. if (outEvents != NULL) *outEvents = events;
  10. if (outData != NULL) *outData = data;
  11. return ident;
  12. }
  13. }

在pollOnce中,会先处理没有callback的response(ALOOPER_POLL_CALLBACK = -2),处理完后会执行pollInner方法

  1. // 移除了部分细节处理和日志代码
  2. // 添加了分析源码的日志
  3. int Looper::pollInner(int timeoutMillis) {
  4. if (timeoutMillis != 0 && mNextMessageUptime != LLONG_MAX) {
  5. nsecs_t now = systemTime(SYSTEM_TIME_MONOTONIC);
  6. int messageTimeoutMillis = toMillisecondTimeoutDelay(now, mNextMessageUptime);
  7. if (messageTimeoutMillis >= 0
  8. && (timeoutMillis < 0 || messageTimeoutMillis < timeoutMillis)) {
  9. timeoutMillis = messageTimeoutMillis;
  10. }
  11. }
  12. // Poll.
  13. int result = ALOOPER_POLL_WAKE;
  14. mResponses.clear();
  15. mResponseIndex = 0;
  16. struct epoll_event eventItems[EPOLL_MAX_EVENTS];
  17. // 等待事件发生或者超时
  18. int eventCount = epoll_wait(mEpollFd, eventItems, EPOLL_MAX_EVENTS, timeoutMillis);
  19. // Acquire lock.
  20. mLock.lock();
  21. // Check for poll error.
  22. // epoll 事件小于0, 发生错误
  23. if (eventCount < 0) {
  24. if (errno == EINTR) {
  25. goto Done;
  26. }
  27. result = ALOOPER_POLL_ERROR;
  28. goto Done;
  29. }
  30. if (eventCount == 0) {
  31. // epoll事件为0,超时,直接跳转到Done
  32. result = ALOOPER_POLL_TIMEOUT;
  33. goto Done;
  34. }
  35. //循环遍历,处理所有的事件
  36. for (int i = 0; i < eventCount; i++) {
  37. int fd = eventItems[i].data.fd;
  38. uint32_t epollEvents = eventItems[i].events;
  39. if (fd == mWakeReadPipeFd) {
  40. if (epollEvents & EPOLLIN) {
  41. awoken();  //唤醒,读取管道里面的事件
  42. } else {
  43. }
  44. } else {
  45. ssize_t requestIndex = mRequests.indexOfKey(fd);
  46. if (requestIndex >= 0) {
  47. int events = 0;
  48. // 处理request,生成response对象,push到相应的Vector
  49. pushResponse(events, mRequests.valueAt(requestIndex));
  50. } else {
  51. }
  52. }
  53. }
  54. Done: ;
  55. // Invoke pending message callbacks.
  56. // 发生超时的逻辑处理
  57. mNextMessageUptime = LLONG_MAX;
  58. while (mMessageEnvelopes.size() != 0) {
  59. // 处理Native端的Message
  60. nsecs_t now = systemTime(SYSTEM_TIME_MONOTONIC);
  61. const MessageEnvelope& messageEnvelope = mMessageEnvelopes.itemAt(0);
  62. if (messageEnvelope.uptime <= now) {
  63. // Remove the envelope from the list.
  64. // We keep a strong reference to the handler until the call to handleMessage
  65. // finishes.  Then we drop it so that the handler can be deleted *before*
  66. // we reacquire our lock.
  67. { // obtain handler
  68. sp<MessageHandler> handler = messageEnvelope.handler;
  69. Message message = messageEnvelope.message;
  70. mMessageEnvelopes.removeAt(0);
  71. mSendingMessage = true;
  72. mLock.unlock();
  73. handler->handleMessage(message);   // 处理消息事件
  74. } // release handler
  75. mLock.lock();
  76. mSendingMessage = false;
  77. result = ALOOPER_POLL_CALLBACK;   // 设置回调
  78. } else {
  79. // The last message left at the head of the queue determines the next wakeup time.
  80. mNextMessageUptime = messageEnvelope.uptime;
  81. break;
  82. }
  83. }
  84. // Release lock.
  85. mLock.unlock();
  86. // Invoke all response callbacks.
  87. // 执行回调
  88. for (size_t i = 0; i < mResponses.size(); i++) {
  89. Response& response = mResponses.editItemAt(i);
  90. if (response.request.ident == ALOOPER_POLL_CALLBACK) {
  91. int fd = response.request.fd;
  92. int events = response.events;
  93. void* data = response.request.data;
  94. int callbackResult = response.request.callback->handleEvent(fd, events, data);
  95. if (callbackResult == 0) {
  96. removeFd(fd);  //移除fd
  97. }
  98. // Clear the callback reference in the response structure promptly because we
  99. // will not clear the response vector itself until the next poll.
  100. response.request.callback.clear();  // 清除reponse引用的回调方法
  101. result = ALOOPER_POLL_CALLBACK;  // 发生回调
  102. }
  103. }
  104. return result;
  105. }

看到这里,我们其实可以看出来整体消息模型由 native 和 Java 2层组成,2层各自有自己的消息系统。 Java层通过调用 pollonce 来达到调用底层epoll 让死循环进入阻塞休眠的状态,以避免浪费CPU, 所以这也解释了为什么Android Looper的死循环为什么不会让主线程CPU占用率飙升。

java层和native层的对应图如下:

备注

  • Java 层和 native 层通过 MessageQueue 里面持有一个 native 的MessageQueue 对象进行交互。WeakMessageHandler 继承自MessageHandler,NativeMessageQueue 继承自 MessageQueue
  • Java 层和 native 层实质是各自维护了一套相似的消息系统。C层发出的消息和Java层发出的消息可以没有任何关系。所以 Framework 层只是很巧的利用了底层 epoll 的机制达到阻塞的目的。
  • 通过 pollOnce 的分析,可以发现消息的处理其实是有顺序的,首先是处理native message,然后处理native request,最后才会执行java层,处理java层的message

可以在子线程中创建Handler吗?为什么每个线程只会有一个Looper?

在很多时候,我们可以遇到这2个问题。既然看了 Handler 的源码,那么,我们就顺便分析一下这 2 个问题。

查看Handler的构造方法,无参构造方法最后会调用

  1. public Handler(Callback callback, boolean async) {
  2. mLooper = Looper.myLooper();
  3. if (mLooper == null) {
  4. throw new RuntimeException(
  5. "Can't create handler inside thread that has not called Looper.prepare()");
  6. }
  7. mQueue = mLooper.mQueue;
  8. mCallback = callback;
  9. mAsynchronous = async;
  10. }

可以看到,这里会直接获取Looper

  1. public static @Nullable Looper myLooper() {
  2. return sThreadLocal.get();
  3. }

这里会把每个 Looper 存到相应的ThreadLocal对象中,如果子线程直接创建了Handler,Looper 就会是一个null,所以会直接跑出一个"Can't create handler inside thread that has not called Looper.prepare()"的RuntimeException

那么我们是何时把Looper放入ThreadLocal对象的呢?可以在Looper.prepare()中找到答案

  1. private static void prepare(boolean quitAllowed) {
  2. if (sThreadLocal.get() != null) {
  3. throw new RuntimeException("Only one Looper may be created per thread");
  4. }
  5. sThreadLocal.set(new Looper(quitAllowed));
  6. }

这也解释了,在每个 Thread 中,只会存在一个 Looper 对象。如果我们想在子线程中正常创建 Handler,就需要提前运行当前线程的 Looper,调用

  1. Looper.prepare()

就不会抛出异常了。

总结

消息机制作为 Android 的基础,还是非常有深入了解的必要。对于我们遇到Handler发送消息的时候跑出的系统异常的排查也很有意义。

特别感谢

本次源码的阅读过程中,遇到了很多不了解的问题例如epoll,这里非常感谢IO哥(查看IO哥大佬)助和指导。让我在某些细节问题上暂时绕过和恍然大悟。

深入理解Android消息机制的更多相关文章

  1. 深入理解 Android 消息机制原理

    欢迎大家前往腾讯云社区,获取更多腾讯海量技术实践干货哦~ 作者:汪毅雄 导语: 本文讲述的是Android的消息机制原理,从Java到Native代码进行了梳理,并结合其中使用到的Epoll模型予以介 ...

  2. Android消息机制不完全解析(上)

        Handler和Message是Android开发者常用的两个API,我一直对于它的内部实现比较好奇,所以用空闲的时间,阅读了一下他们的源码.    相关的Java Class: androi ...

  3. 史上最详细的Android消息机制源码解析

    本人只是Android菜鸡一个,写技术文章只是为了总结自己最近学习到的知识,从来不敢为人师,如果里面有不正确的地方请大家尽情指出,谢谢! 606页Android最新面试题含答案,有兴趣可以点击获取. ...

  4. Android消息机制:Looper,MessageQueue,Message与handler

    Android消息机制好多人都讲过,但是自己去翻源码的时候才能明白. 今天试着讲一下,因为目标是讲清楚整体逻辑,所以不追究细节. Message是消息机制的核心,所以从Message讲起. 1.Mes ...

  5. Android消息机制不完全解析(下)

    接着上一篇文章Android消息机制不完全解析(上),接着看C++部分的实现. 首先,看看在/frameworks/base/core/jni/android_os_MessageQueue.cpp文 ...

  6. Android 消息机制 (Handler、Message、Looper)

    综合:http://blog.csdn.net/dadoneo/article/details/7667726 与 http://android.tgbus.com/Android/androidne ...

  7. Android开发之漫漫长途 ⅥI——Android消息机制(Looper Handler MessageQueue Message)

    该文章是一个系列文章,是本人在Android开发的漫漫长途上的一点感想和记录,我会尽量按照先易后难的顺序进行编写该系列.该系列引用了<Android开发艺术探索>以及<深入理解And ...

  8. Android开发之漫漫长途 Ⅶ——Android消息机制(Looper Handler MessageQueue Message)

    该文章是一个系列文章,是本人在Android开发的漫漫长途上的一点感想和记录,我会尽量按照先易后难的顺序进行编写该系列.该系列引用了<Android开发艺术探索>以及<深入理解And ...

  9. Android 进阶14:源码解读 Android 消息机制( Message MessageQueue Handler Looper)

    不要心急,一点一点的进步才是最靠谱的. 读完本文你将了解: 前言 Message 如何获取一个消息 Messageobtain 消息的回收利用 MessageQueue MessageQueue 的属 ...

随机推荐

  1. JVM之Java运行时数据区(线程隔离区)

    来源 JVM会在会在执行Java程序过程中把所管理的内存划分为若干区域,主要包括程序计数器(Program Counter Register),虚拟机栈(VM Stack),本地方法栈(Native ...

  2. ubunu安装qq、微信等、

    参考: https://www.lulinux.com/archives/1319 安装下面下载deepin-wine-for-ubuntu,然后进去安装 https://github.com/wsz ...

  3. .net core 版本支持

    NetCore sdk并不是每个版本都支持VS2017工具,也不是每个版本的sdk版本号和Runtime版本号都一样,这就需要我们在创建某个版本的net core应用时注意:使用不同版本的vs时需要对 ...

  4. FOR XML PATH 函数用法

    一.FOR XML PATH 简单介绍              那么还是首先来介绍一下FOR XML PATH ,假设现在有一张兴趣爱好表(hobby)用来存放兴趣爱好,表结构如下: 接下来我们来看 ...

  5. LINQ to Entities不识别C#语法报错

    错误:报错不识别string.Join…… var QueryWithStandard=from a in listA join b in listB on a.ID equals b.AID int ...

  6. Java进阶知识23 Spring对JDBC的支持

    1.最主要的代码 Spring 配置文件(beans.xml) <!-- 连接池 --> <bean id="dataSource" class="co ...

  7. leetcode解题报告(10):Merge Two Sorted Lists

    描述 Merge two sorted linked lists and return it as a new list. > The new list should be made by sp ...

  8. python编写弹球游戏的实现代码

    #coding:utf- from tkinter import * import random import time class Ball: #创建一个球类 def __init__(self, ...

  9. hibernate-validator校验框架学习

    1.引入jar包 <dependency> <groupId>org.hibernate</groupId> <artifactId>hibernate ...

  10. HTML、 CSS、 JavaScript三者的关系

    HTML. CSS. JavaScript三者的关系    网页主要由三部分组成: 结构( Structure) . 表现( Presentation) 和行为( Behavior)    HTML ...