1.三者的之间的关系

ThreadLocalMap是Thread类的成员变量threadLocals，一个线程拥有一个ThreadLocalMap,一个ThreadLocalMap可以有多个ThreadLocal。

ThreadLocalMap是ThreadLocal的内部类，ThreadLocal的set(),get(),remove()方法其实都是对ThreadLocalMap的操作。ThreadLocalMap中是以内部类Entry的形式关联ThreadLocal和对应的Value，其中Entry对ThreadLocal为弱引用(WeakReference<>).

如下图，大概描述了下三者的关系

2: 结构分析

首先看下Thread类,可以看到有个ThreadLocalMap类型的成员变量threadLocals,之后所有针对当前线程的ThreadLocal的存取，都是该变量来操作。

public class Thread implements Runnable {

 /* ThreadLocal values pertaining to this thread. This map is maintained

     * by the ThreadLocal class. */

    ThreadLocal.ThreadLocalMap threadLocals = null;
}

再来看下ThreadLocalMap的结构，它是ThreadLocal的内部类

 static class ThreadLocalMap {
        //内部类Entry继承了弱引用()

        static class Entry extends WeakReference<ThreadLocal<?>> {

            /** The value associated with this ThreadLocal. */
            //通过ThreLocal.set()保存的值

            Object value;

            
            //构造函数

            Entry(ThreadLocal<?> k, Object v) {
                //调用WeakReference的构造方法，实现Entry对ThreadLocal的弱引用

                super(k);

                value = v;

            }

        }

        /**

         * 初始容量，即table的初始化大小

         */

        private static final int INITIAL_CAPACITY = 16;

        /**

         * Entry数组，用来保存每一个ThreadLocal

         */

        private Entry[] table;

        /**

         * 当前table中实际存放的Entry的数量

         */

        private int size = 0;

        /**

         * 扩容阈值，默认为0

         */

        private int threshold; // Default to 0

        /**

         * Set the resize threshold to maintain at worst a 2/3 load factor.
          设置扩容阈值的方法，可以看到ThreadLocalMap中的扩容的负载因子为2/3

         */

        private void setThreshold(int len) {

            threshold = len * 2 / 3;

        }

3.完整流程分析

正常情况下我们使用ThreadLocal来存取变量都是这样的

        ThreadLocal<String> test = new ThreadLocal<>();

        test.set("111");

首先看下ThreadLocal.set(T value)方法

    public void set(T value) {
        //获取当前线程

        Thread t = Thread.currentThread();
        //根据线程获取ThreLocalMap,其实就是获取Thread的成员变量

        ThreadLocalMap map = getMap(t);
        //如果map!=null,则则将当前ThreadLocal进行设置

        if (map != null)

            map.set(this, value);

        else
        //map==null，则对该线程的ThreadLocalMap进行初始化

            createMap(t, value);

    }

ThreadLocalMap getMap(Thread t) {
    return t.threadLocals;
}

当前线程第一次使用ThreadLocal, createMap()方法初始化ThreadLocalMap

    void createMap(Thread t, T firstValue) {

        t.threadLocals = new ThreadLocalMap(this, firstValue);

    }

        ThreadLocalMap(ThreadLocal<?> firstKey, Object firstValue) {
            //初始化table,初始化大小为16

            table = new Entry[INITIAL_CAPACITY];
            //计算插入的数组下标，将threadLocael的hashcode与15进行按位异或操作

            int i = firstKey.threadLocalHashCode & (INITIAL_CAPACITY - 1);
            //将新构建的Entry放到计算的数组下标上

            table[i] = new Entry(firstKey, firstValue);
            //table中实际长度赋值1

            size = 1;
            //设置扩容阈值，这个方法我们上面看到过，内部算法就是initial_capacity * 2/3

            setThreshold(INITIAL_CAPACITY);

        }

ThreadLocalMap已经存在，再次添加ThreadLocal

        private void set(ThreadLocal<?> key, Object value) {

            //获取当前table

            Entry[] tab = table;

            int len = tab.length;
            //计算出数组插入下标

            int i = key.threadLocalHashCode & (len-1);

            //从计算出的下标位置i开始遍历table数组，直到下一个元素Entry为null时停止
            //这里解决Hash冲突的方法采用的线性探测法，计算出的位置有值的话就相邻的向下一直探索直到有位置

            for (Entry e = tab[i];

                 e != null;

                 e = tab[i = nextIndex(i, len)]) {

                ThreadLocal<?> k = e.get();

                //判断当前遍历的ThreadLocale是否和添加进来的key相等

                if (k == key) {
                    //更新value

                    e.value = value;

                    return;

                }

                //如果存在Entry中ThreadLocal为null的情况，即该线程变量已过时，则对过时的Entry进行清除

                if (k == null) {

                    replaceStaleEntry(key, value, i);

                    return;

                }

            }

            //走到这里说明目前的table中不存在该ThreadLocale,则创建新Entry放到计算的下标处

            tab[i] = new Entry(key, value);
            //table实际长度+1

            int sz = ++size;
            //if(!快速遍历一遍table判断是否存在Entry中ThreadLocal为null的情况&&当前table的实际长度>=扩容阈值) 则进行扩容

            if (!cleanSomeSlots(i, sz) && sz >= threshold)

                rehash();

        }

看完了ThreadLocal的set()方法，再来看get()方法

    public T get() {
        //获取当前线程

        Thread t = Thread.currentThread();
        //获取当前线程持有的ThreadLocalMap

        ThreadLocalMap map = getMap(t);

        if (map != null) {

            ThreadLocalMap.Entry e = map.getEntry(this);

            if (e != null) {

                @SuppressWarnings("unchecked")
                //返回的Entry!=null的话直接返回其储存的value值

                T result = (T)e.value;

                return result;

            }

        }
        //如果ThreadLocalMap==null或者找不到该Entry,返回设置的默认值

        return setInitialValue();

    }

ThreadLocalMap!=null时调用getEntry()方法

        private Entry getEntry(ThreadLocal<?> key) {
            //计算出在table中的数组下标

            int i = key.threadLocalHashCode & (table.length - 1);
            //获取指定下标中的E

            Entry e = table[i];
            //如果Entry!=&&ThreadLocal==当前的ThreadLocale,直接返回该Entry

            if (e != null && e.get() == key)

                return e;

            else
            //找到的元素不对或者位置上没有元素

                return getEntryAfterMiss(key, i, e);

        }

        private Entry getEntryAfterMiss(ThreadLocal<?> key, int i, Entry e) {
           //获取当前table

            Entry[] tab = table;
           //获取table长度

            int len = tab.length;

            while (e != null) {
           //如果Entry!=null，就取出来再判断一下ThreadLocal是否相同

                ThreadLocal<?> k = e.get();

                if (k == key)

                    return e;

                if (k == null)
                   //清除掉key已失效的E

                    expungeStaleEntry(i);

                else

                    //以当前的数组下标下后遍历Entry，因为set()时插入Entry发生Hash冲突时用的是线性探测法解决的，所以get()查找时也按此原则
                    i = nextIndex(i, len);

                e = tab[i];

            }
           //如果遍历完table都找不到，返回null

            return null;

        }

get()获取时ThreadLocalMap还为空时调用的初始化方法setInitialValue()方法

    private T setInitialValue() {
        //获取初始化value，该方法内部直接返回的为null

        T value = initialValue();
        //获取当前线程

        Thread t = Thread.currentThread();
        //获取该线程的ThreadLocalMap

        ThreadLocalMap map = getMap(t);
        //如果map!=null,则用初始化的值来添加

        if (map != null)

            map.set(this, value);

        else
         //如果map==null，则用这个初始化值null和当前的这个ThreadLocal来创建ThreadLocalMap进行初始化
            createMap(t, value);

        return value;

    }

使用完ThreadLocal,最好清除下remove()

     public void remove() {
         //获取当前线程的ThreadLocalMap

         ThreadLocalMap m = getMap(Thread.currentThread());

         if (m != null)
             map!=null就进行删除

             m.remove(this);

     }

        private void remove(ThreadLocal<?> key) {

            Entry[] tab = table;

            int len = tab.length;

            int i = key.threadLocalHashCode & (len-1);
            //获取到下标后线性探测法遍历table,找到后进行删除

            for (Entry e = tab[i];

                 e != null;

                 e = tab[i = nextIndex(i, len)]) {

                if (e.get() == key) {

                    e.clear();

                    expungeStaleEntry(i);

                    return;

                }

            }

        }

remove()调用的关联方法：

    public void clear() {
        //将Entry内部的弱引用的ThreadLocal置为null,方便下一次GC时进行对ThreadLocal对象进行回收

        this.referent = null;

    }


        //释放table中的Entry

        private int expungeStaleEntry(int staleSlot) {

            Entry[] tab = table;

            int len = tab.length;

            //将Entry的value的引用置为null,此时Entry不再持有任何引用，ThreadLocal和value的引用都已清除，

            // expunge entry at staleSlot

            tab[staleSlot].value = null;
            //将该位置的Entry的引用置为null，此时此Entry也不再被table强引用，下次GC时也会回收

            tab[staleSlot] = null;
            //table实际长度-1

            size--;

            // Rehash until we encounter null

            Entry e;

            int i;

            for (i = nextIndex(staleSlot, len);

                 (e = tab[i]) != null;

                 i = nextIndex(i, len)) {

                ThreadLocal<?> k = e.get();

                if (k == null) {

                    e.value = null;

                    tab[i] = null;

                    size--;

                } else {

                    int h = k.threadLocalHashCode & (len - 1);

                    if (h != i) {

                        tab[i] = null;

                        // Unlike Knuth 6.4 Algorithm R, we must scan until

                        // null because multiple entries could have been stale.

                        while (tab[h] != null)

                            h = nextIndex(h, len);

                        tab[h] = e;

                    }

                }

            }

            return i;

        }

4.ThreadLocal内存泄漏问题分析

通过上述的源码我们ThreadLocal的使用及原理有了大致的了解，那么在使用ThreadLocal的同时很大可能会出现内存泄漏问题，下面我们来探讨下这究竟是怎么回事，图来源于网络

当一个Thread使用完ThreadLocal存储变量完，对应的ThreadLocal的引用被清除，这时候该ThreadLocal的强引用被清除，但是Thread的ThreadLocalMap中的Entry的key还存在着ThreadLocal的弱引用，当发生Young GC时该弱引用就会被清除，这时就会存在Entry中key=null，这导致该ThreadLocalMap永远访问不到该value，value就会内存泄漏，除非ThreadLocalMap对象也被清除。

这是由于Threrd和ThreadLocalMap的生命周期一样长，如果该在ThreadLocal清除后该Thread一直存活，那么就一直存在着value内存泄漏的问题。

既然使用了对ThreadLocal的弱引用出现了Entry中value的内存泄露，那为什么还要使用弱引用呢？如果变成强引用呢？

我们来看下，如果Entry中变成强引用ThreadLocal, 当外部的ThreadLocal强引用被清除后，由于Entry内部还有强引用，但外部又无法再通过ThreadLocal访问到，就会导致Entry的内存泄漏，泄漏对象变的更大，并且GC回收时也不会回收该Entry对象。

针对该内存泄漏现象，官方也做了相应的处理，我们在上面的源码中可以看到，不管是在调用ThreadLocal的set(),get()还是remove()方法每次在调用时遍历table的时候会因为hash冲突向下遍历一段距离，这遍历过程中如果有发现Entry中ThreadLocal为null的情况，会进行处理，将Entry完全清除掉，但是这个遍历的范围非常有限，很有可能遍历不到为null的那个Entry，即使set()方法在第一次插入ThreadLocal时还会进行一次快速的遍历table，但终究不是完全遍历，所以通过官方的优化，内存泄漏的问题还是不能够很好的解决。

内存泄漏的问题我们使用规范的话，完全是可以避免的：

1.在每次使用完ThreadLocal时，使用ThreadLocal.remove()方法，这样就会清除调Entry中的key和value的引用。

2.将ThreadLocal对象设置为private static 变成共享对象，让所有线程都使用该ThreadLocal对象，这样ThreadLocal就一直存在外部强引用，GC时就不会清除Entry的ThreadLocal，不出出现内存泄漏，但是加大了内存开销，尽量还是使用完就使用remove()进行处理。

另外一提：

因为线程池中的线程会存在复用，所以可以能存在读出脏数据的问题。即当线程池中某个线程使用ThreadLocal存储数据时，使用过后没有remove，等下次从线程池调用到该线程的时候，就会读到该线程上一次执行任务时的数据。所以务必需要remove()。

ps: 由于笔者水平有限，可能存在一些地方理解不正确，希望大家能够指出。

从源码看Thread&ThreadLocal&ThreadLocalMap的关系与原理的更多相关文章

解密随机数生成器（二）——从java源码看线性同余算法
Random Java中的Random类生成的是伪随机数,使用的是48-bit的种子,然后调用一个linear congruential formula线性同余方程(Donald Knuth的编程艺术 ...
从源码看JDK提供的线程池（ThreadPoolExecutor）
一丶什么是线程池 (1)博主在听到线程池三个字的时候第一个想法就是数据库连接池,回忆一下,我们在学JavaWeb的时候怎么理解数据库连接池的,数据库创建连接和关闭连接是一个比较耗费资源的事情,对于那些 ...
从jvm源码看synchronized
从jvm源码看synchronized 索引 synchronized的使用修饰实例方法修饰静态方法修饰代码块总结 Synchronzied的底层原理对象头和内置锁(ObjectMonito ...
Alink漫谈(二) : 从源码看机器学习平台Alink设计和架构
Alink漫谈(二) : 从源码看机器学习平台Alink设计和架构目录 Alink漫谈(二) : 从源码看机器学习平台Alink设计和架构 0x00 摘要 0x01 Alink设计原则 0x02 A ...
从linux源码看epoll
从linux源码看epoll 前言在linux的高性能网络编程中,绕不开的就是epoll.和select.poll等系统调用相比,epoll在需要监视大量文件描述符并且其中只有少数活跃的时候,表现出 ...
JNI-从jvm源码分析Thread.interrupt的系统级别线程打断原理
前言在java编程中,我们经常会调用Thread.sleep()方法使得线程停止运行一段时间,而Thread类中也提供了interrupt方法供我们去主动打断一个线程.那么线程挂起和打断的本质究竟是 ...
从源码看Azkaban作业流下发过程
上一篇零散地罗列了看源码时记录的一些类的信息,这篇完整介绍一个作业流在Azkaban中的执行过程,希望可以帮助刚刚接手Azkaban相关工作的开发.测试. 一.Azkaban简介 Azkaban作为开 ...
从源码看Android中sqlite是怎么通过cursorwindow读DB的
更多内容在这里查看 https://ahangchen.gitbooks.io/windy-afternoon/content/ 执行query 执行SQLiteDatabase类中query系列函数 ...
从源码看Android中sqlite是怎么读DB的（转）
执行query 执行SQLiteDatabase类中query系列函数时,只会构造查询信息,不会执行查询. (query的源码追踪路径) 执行move(里面的fillwindow是真正打开文件句柄并分 ...

随机推荐

【pycharm】Python pip升级及升级失败解决方案，报错：You are using pip version 10.0.1, however version 21.3.1 is available. You should consider upgrading via the 'python -m pip install --upgrade pip' command.
我已经升级到了最新的版本安装其他模块过程中出现下面提示,便说明你需要升级pip You are using pip version 10.0.1, however version 21.3.1 is ...
大数据SQL中的Join谓词下推，真的那么难懂？
听到谓词下推这个词,是不是觉得很高大上,找点资料看了半天才能搞懂概念和思想,借这个机会好好学习一下吧. 引用范欣欣大佬的博客中写道,以前经常满大街听到谓词下推,然而对谓词下推却总感觉懵懵懂懂,并不明白 ...
一.Promise入门准备阶段
一.Promise入门准备阶段 1.区别实例对象呵函数对象 2.两种类型的回调函数(同步与异步) 2.1 同步回调 2.2 异步回调 3.JS的error处理 3.1 错误的类型 3.2 错误处理与错 ...
IDEA格式化项目中所有文件的方法
1,单个文件打开后,直接快捷键Ctrl+Alt+L就可将当前文件格式化 2,快捷键Ctrl+Alt+O可将import格式化(删除无用的import) 3,如果需要格式化整个项目的所有代码,在项目名上 ...
redis sentinel搭建
/usr/local/bin /usr/local/etc https://www.centos.bz/2017/08/redis-3-x-sentinel-ha-service/ https://w ...
菜鸡的Java笔记第二 - java 数据类型
1.程序的本质实际上就是在于数据的处理上. JAVA中的数据类型有两类基本数据类型:是进行内容的操作而不是内存的操作数值型: 整型:byte(-128 ~ 127),short(-32768 ~ ...
自定义 OpenShift s2i 镜像与模板——OracleJDK8
本文目标由于 OpenShift 官方提供的镜像与模板(OpenJDK8)不完全满足业务需要: 不包含飞行记录功能.只有 OpenJDK11 以上才被 Oracle 开源生成堆 dump 很大很慢 ...
Roslyn+T4+EnvDTE项目完全自动化 (一)
前言以前做一个金融软件项目,软件要英文.繁体版本,开始甲方弄了好几个月,手动一条一条替换,发现很容易出错,因为有金融专业术语,字符串在不同语义要特殊处理,第三方工具没法使用.最后我用Roslyn写了 ...
Abp Vnext Blazor替换UI组件集成BootstrapBlazor(详细过程)
Abp Vnext自带的blazor项目使用的是 Blazorise,但是试用后发现不支持多标签.于是想替换为BootstrapBlazor. 过程比较复杂,本人已经把模块写好了只需要替换掉即可. 点 ...
AT4168 [ARC100C] Or Plus Max
从\(whk\)回来了. 考虑我们需要维护一个子集的信息. 对于二进制的子集信息维护有一个很经典的操作: 高维前缀和. AT4168 [ARC100C] Or Plus Max // Problem: ...