Java面试-List中的sort详细解读

最近看了一些排序相关的文章，因此比较好奇，Java中的排序是如何做的。本片文章介绍的是JDK1.8，List中的sort方法。

先来看看List中的sort是怎么写的：

    @SuppressWarnings({"unchecked", "rawtypes"})

    default void sort(Comparator<? super E> c) {

        Object[] a = this.toArray();

        Arrays.sort(a, (Comparator) c);

        ListIterator<E> i = this.listIterator();

        for (Object e : a) {

            i.next();

            i.set((E) e);

        }

    }

首先，你需要传入一个比较器作为参数，这个好理解，毕竟你肯定要定一个比较标准。然后就是将list转换成一个数组，再对这个数组进行排序，排序完之后，再利用iterator重新改变list。

接着，我们再来看看Arrays.sort：

    public static <T> void sort(T[] a, Comparator<? super T> c) {

        if (c == null) {

            sort(a);

        } else {

            if (LegacyMergeSort.userRequested)

                legacyMergeSort(a, c);

            else

                TimSort.sort(a, 0, a.length, c, null, 0, 0);

        }

    }

    public static void sort(Object[] a) {

        if (LegacyMergeSort.userRequested)

            legacyMergeSort(a);

        else

            ComparableTimSort.sort(a, 0, a.length, null, 0, 0);

    }

    static final class LegacyMergeSort {

        private static final boolean userRequested =

            java.security.AccessController.doPrivileged(

                new sun.security.action.GetBooleanAction(

                    "java.util.Arrays.useLegacyMergeSort")).booleanValue();

    }

这样可以看出，其实排序的核心就是TimSort，LegacyMergeSort大致意思是表明如果版本很旧的话，就用这个，新版本是不会采用这种排序方式的。

我们再来看看TimSort的实现：

    private static final int MIN_MERGE = 32;

    static <T> void sort(T[] a, int lo, int hi, Comparator<? super T> c,

                         T[] work, int workBase, int workLen) {

        assert c != null && a != null && lo >= 0 && lo <= hi && hi <= a.length;

        int nRemaining  = hi - lo;

        if (nRemaining < 2)

            return;  // Arrays of size 0 and 1 are always sorted

        // If array is small, do a "mini-TimSort" with no merges

        if (nRemaining < MIN_MERGE) {

            // 获得最长的递增序列

            int initRunLen = countRunAndMakeAscending(a, lo, hi, c);

            binarySort(a, lo, hi, lo + initRunLen, c);

            return;

        }

        /**

         * March over the array once, left to right, finding natural runs,

         * extending short natural runs to minRun elements, and merging runs

         * to maintain stack invariant.

         */

        TimSort<T> ts = new TimSort<>(a, c, work, workBase, workLen);

        int minRun = minRunLength(nRemaining);

        do {

            // Identify next run

            int runLen = countRunAndMakeAscending(a, lo, hi, c);

            // If run is short, extend to min(minRun, nRemaining)

            if (runLen < minRun) {

                int force = nRemaining <= minRun ? nRemaining : minRun;

                binarySort(a, lo, lo + force, lo + runLen, c);

                runLen = force;

            }

            // Push run onto pending-run stack, and maybe merge

            ts.pushRun(lo, runLen);

            ts.mergeCollapse();

            // Advance to find next run

            lo += runLen;

            nRemaining -= runLen;

        } while (nRemaining != 0);

        // Merge all remaining runs to complete sort

        assert lo == hi;

        ts.mergeForceCollapse();

        assert ts.stackSize == 1;

    }

如果小于2个，代表不再不需要排序；如果小于32个，则采用优化的二分排序。怎么优化的呢？首先获得最长的递增序列：

    private static <T> int countRunAndMakeAscending(T[] a, int lo, int hi,

                                                    Comparator<? super T> c) {

        assert lo < hi;

        int runHi = lo + 1;

        if (runHi == hi)

            return 1;

        // Find end of run, and reverse range if descending

        if (c.compare(a[runHi++], a[lo]) < 0) { // Descending

            // 一开始是递减序列，就找出最长递减序列的最后一个下标

            while (runHi < hi && c.compare(a[runHi], a[runHi - 1]) < 0)

                runHi++;

            // 逆转前面的递减序列

            reverseRange(a, lo, runHi);

        } else {                              // Ascending

            while (runHi < hi && c.compare(a[runHi], a[runHi - 1]) >= 0)

                runHi++;

        }

        return runHi - lo;

    }

接着进行二分排序：

    private static <T> void binarySort(T[] a, int lo, int hi, int start,

                                       Comparator<? super T> c) {

        assert lo <= start && start <= hi;

        if (start == lo)

            start++;

        for ( ; start < hi; start++) {

            T pivot = a[start];

            // Set left (and right) to the index where a[start] (pivot) belongs

            int left = lo;

            int right = start;

            assert left <= right;

            /*

             * Invariants:

             *   pivot >= all in [lo, left).

             *   pivot <  all in [right, start).

             */

            // start位置是递增序列后的第一个数的位置

            // 从前面的递增序列中找出start位置的数应该处于的位置

            while (left < right) {

                // >>> 无符号右移

                int mid = (left + right) >>> 1;

                if (c.compare(pivot, a[mid]) < 0)

                    right = mid;

                else

                    left = mid + 1;

            }

            assert left == right;

            /*

             * The invariants still hold: pivot >= all in [lo, left) and

             * pivot < all in [left, start), so pivot belongs at left.  Note

             * that if there are elements equal to pivot, left points to the

             * first slot after them -- that's why this sort is stable.

             * Slide elements over to make room for pivot.

             */

            int n = start - left;  // The number of elements to move

            // Switch is just an optimization for arraycopy in default case

            // 比pivot大的数往后移动一位

            switch (n) {

                case 2:  a[left + 2] = a[left + 1];

                case 1:  a[left + 1] = a[left];

                         break;

                default: System.arraycopy(a, left, a, left + 1, n);

            }

            a[left] = pivot;

        }

    }

好了，待排序数量小于32个的讲完了，现在来说说大于等于32个情况。首先，获得一个叫minRun的东西，这是个啥含义呢：

    int minRun = minRunLength(nRemaining);

    private static int minRunLength(int n) {

        assert n >= 0;

        int r = 0;      // Becomes 1 if any 1 bits are shifted off

        while (n >= MIN_MERGE) {

            // 这里我没搞懂的是为什么不直接将(n & 1)赋值给r，而要做一次逻辑或。

            r |= (n & 1);

            n >>= 1;

        }

        return n + r;

    }

各种位运算符，MIN_MERGE默认为32，如果n小于此值，那么返回n本身。否则会将n不断地右移，直到小于MIN_MERGE，同时记录一个r值，r代表最后一次移位n时，n最低位是0还是1。

其实看注释比较容易理解：

Returns the minimum acceptable run length for an array of the specified length. Natural runs shorter than this will be extended with binarySort.

Roughly speaking, the computation is: If n < MIN_MERGE, return n (it's too small to bother with fancy stuff).

Else if n is an exact power of 2, return MIN_MERGE/2.

Else return an int k, MIN_MERGE/2 <= k <= MIN_MERGE, such that n/k is close to, but strictly less than, an exact power of 2. For the rationale, see listsort.txt.

返回结果其实就是用于接下来的合并排序中。

接下来就是一个while循环

        do {

            // Identify next run

            // 获得一个最长递增序列

            int runLen = countRunAndMakeAscending(a, lo, hi, c);

            // If run is short, extend to min(minRun, nRemaining)

            // 如果最长递增序列

            if (runLen < minRun) {

                int force = nRemaining <= minRun ? nRemaining : minRun;

                binarySort(a, lo, lo + force, lo + runLen, c);

                runLen = force;

            }

            // Push run onto pending-run stack, and maybe merge

            // lo——runLen为将要被归并的范围

            ts.pushRun(lo, runLen);

            // 归并

            ts.mergeCollapse();

            // Advance to find next run

            lo += runLen;

            nRemaining -= runLen;

        } while (nRemaining != 0);

这样，假设你的每次归并排序的两个序列为r1和r2，r1肯定是有序的，r2也已经被排成递增序列了，因此这样的归并排序就比较特殊了。

为什么要用归并排序呢，因为归并排序的时间复杂度永远为O(nlogn)，空间复杂度为O(n)，以空间换取时间。

好了，以上就是针对Java中的排序做的一次总结，但具体的归并代码还没有分析，其实我自己也没有完全研究透，为什么minRun的取值是这样的，这也和TimSort中的stackLen有关，有兴趣的小伙伴可以在下方留言，我们可以一起探讨。

有兴趣的话可以关注我的公众号，说不定会有意外的惊喜。

Java面试-List中的sort详细解读的更多相关文章

java初学者必看之构造方法详细解读
java初学者必看之构造方法详细解读构造方法是专门用来创建对象的方法,当我们通过关键字new来创建对象时,其实就是在调用构造方法. 格式 public 类名称(参数类型参数名称){ 方法体 } 注 ...
java.util.ComparableTimSort中的sort()方法简单分析
TimSort算法是一种起源于归并排序和插入排序的混合排序算法,设计初衷是为了在真实世界中的各种数据中能够有较好的性能. 该算法最初是由Tim Peters于2002年在Python语言中提出的. T ...
java EL表达式中${param.name}详细
在浏览器地址输入,表示传入一个参数test,值为123 URL:http://localhost:8888/Test/index.jsp?test=123 <body> ${test} $ ...
Dockerfile中ADD命令详细解读
ADD指令的功能是将主机构建环境(上下文)目录中的文件和目录.以及一个URL标记的文件拷贝到镜像中. 其格式是: ADD 源路径目标路径 #test FROM ubuntu MAINTAINER ...
[java面试]javascript中dom取值问题radio名字一样归属于同一个组，求点击的是哪一个
题目描述: 看如下的html文件,里面定义了一些radio类型的元素,请完成parse()函数的内容,要求能够弹出对话框提示当前选中的是第几个单选框. </pre><pre code ...
转：最近5年133个Java面试问题列表
最近5年133个Java面试问题列表 Java 面试随着时间的改变而改变.在过去的日子里,当你知道 String 和 StringBuilder 的区别就能让你直接进入第二轮面试,但是现在问题变得越来 ...
近5年133个Java面试问题列表
Java 面试随着时间的改变而改变.在过去的日子里,当你知道 String 和 StringBuilder 的区别就能让你直接进入第二轮面试,但是现在问题变得越来越高级,面试官问的问题也更深入. 在我 ...
最近5年183个Java面试问题列表及答案［最全］
Java 面试随着时间的改变而改变.在过去的日子里,当你知道 String 和 StringBuilder 的区别(String 类型和 StringBuffer 类型的主要性能区别其实在于 Stri ...
最近5年133个Java面试问题列表
Java 面试随着时间的改变而改变.在过去的日子里,当你知道 String 和 StringBuilder 的区别就能让你直接进入第二轮面试,但是现在问题变得越来越高级,面试官问的问题也更深入. 在我 ...

随机推荐

python使用pip安装第三方库以及镜像使用豆瓣源安装第三方库
2018/8/7 在使用pip安装pynum第三方库时的随笔所有的前提都是你成功安装了pip 首先第一步打开命令提示符输入pip show pip 查看当前pip版本然后可以上官网搜索一下 ...
Hadoop学习(8)-scala环境配置及简单使用
学习scala的原因主要是因为以后要学习spark. scala是运行在java虚拟机上的,它是一种面向对象和函数式编程结合的语言,并兼容java程序相对于java更简单安装scala前提你要保证 ...
Spring IoC源码解析之invokeBeanFactoryPostProcessors
一.Bean工厂的后置处理器 Bean工厂的后置处理器:BeanFactoryPostProcessor(触发时机:bean定义注册之后bean实例化之前)和BeanDefinitionRegistr ...
Pandas 库之 DataFrame
How to use DataFrame ? 简介创建 DataFrame 查看与筛选数据:行列选取 DataFrame 数据操作:增删改一.About DataFrame DataFrame 是 ...
搞定java String校招面试题
今天大致的阅读了String类的源码,并刷了常见的面试题,在此做个笔记. 面试题一:判断下列程序运行结果 package String_test; public class test_1 { publ ...
10分钟安装Elasticsearch
关注公众号 itweknow,回复"ES"获取<Elasticsearch权威指南中文版>. 最近在尝试着搭建一个ELK(一个开源的实时日志分析平台),而本文所讲的E ...
Spring Boot + Security + JWT 实现Token验证+多Provider——登录系统
首先呢就是需求: 1.账号.密码进行第一次登录,获得token,之后的每次请求都在请求头里加上这个token就不用带账号.密码或是session了. 2.用户有两种类型,具体表现在数据库中存用户信息时 ...
vi编辑器基础指令
vi -- 终端中的编辑器 visual interface ssh-- secure shell vim vi improved-----------------------------打开和新建文 ...
通过Blazor使用C#开发SPA单页面应用程序(3)
今天我们来看看Blazor开发的一些基本知识. 一.Blazor组件结构 Blazor中组件的基本结构可以分为3个部分,如下所示: //Counter.razor //Directives secti ...
ABAP 金额转换成大写
FUNCTION zzfi_change_amount.*"---------------------------------------------------------------- ...

Java面试-List中的sort详细解读

Java面试-List中的sort详细解读的更多相关文章

随机推荐

热门专题