一、基本思想
桶排序是将待排序的数据分割成许多buckets,然后每个bucket各自排序,或用不同的排序算法,或者递归的使用bucket sort算法。也是典型的分而治之(divide-and-conquer)的策略。
 
二、算法过程及PHP代码实现
1)找出待排序数组arr中的最大值max、最小值min;
2)设置一个定量的数组当作空桶,范围为min~max(min、max为步骤1求得的最小值、最大值);
3)遍历待排序数组arr,计算每个元素arr[i]放的桶,把数据放到对应的桶里;
4)如果桶不为空,对桶中的数据进行排序;
5)遍历桶数组,把所有桶中排序好的元素放到一个新的数组里。
例如:
待排序数组为5,3,5,2,8,其最小值是2,最大值是8,可以在2-8的取值范围内定义一个桶数组$bucket,并且让所有的元素值都为0;
对需要排序的数组进行循环遍历,将数据依次放到对应的桶中,即:
首先是5,则使$bucket[5]++,继续遍历,$bucket[2]=1,$bucket[3]=1,$bucket[5]=2,$bucket[8]=1,
然后循环$bucket数组,若$bucket[2]=1,则循环输出元素2一次,$arr[5]=2,则循环输出5两次,结果为 2 3 5 5 8
PHP代码如下:
<?php
function bucketSort($arr) {
    // 设置木桶
    $bucket = [];
    $min = min($arr);
    $max = max($arr);
    // $bucket = array_fill($min, $max - $min + 1, 0);
    for ($m = $min; $m <= $max; $m++) {
        $bucket[$m] = 0;
    }
    // 将待排数据按照范围放到对应的木桶中
    $cnt = count($arr);
    for ($n = 0; $n < $cnt; $n++) {
        $bucket[$arr[$n]]++;
    }
    // 从木桶中拿出数据
    $result = [];
    for ($i = $min; $i <= $max; $i++) {
        if (($bucket[$i]) > 0) {
            for ($j = 1; $j <= $bucket[$i]; $j++) {
                $result[] = [$i];
            }
        }
    }
    // 处理数组
    $res = [];
    foreach ($result as $v) {
        $res[] = $v[0];
    }
    return $res;
}
 
, 96];
$res = bucketSort($arr);
print_r($res);
设置木桶也可以先确定木桶的个数,即n = (max - min) / arr.length + 1,其中,max、min为待排序数组的最大值、最小值,然后桶的范围为0-(n-1),后面的步骤同前面的3-5步相同。
PHP代码如下:
<?php
function bucketSort(&$arr) {
    $min = min($arr);
    $max = max($arr);
    $n = $max - $min + 1;
    $buckets = [];
    for ($i = 0; $i < $n; $i++) {
        $buckets[$i] = 0;
    }
    for ($i = 0; $i < count($arr); $i++) {
        $buckets[$arr[$i] - $min]++;
    }
    $k = 0;
    for ($i = 0; $i < $n; $i++) {
        while ($buckets[$i]-- > 0) {
            $arr[$k++] = $i + $min;
        }
    }
}
 
三、效率分析
对于N个待排数据,M个桶,
1、时间复杂度:O(N+C),其中C=N*(logN-logM)
2、空间复杂度:O(N+M),稳定性排序
3、缺陷:
1)参与排序的数组存放的必须是整数。
2)数组中的最大数和最小数保持在一个合理的间距内。
3)需要额外的内存空间。
 
四、算法改进
按着上述代码,如果要排序的范围是1-100万,将申请大量的内存,也就是设置了100万个桶。为了节省内存,可以改进这个算法,把待排序数组划分为n个大小相同的子区间(桶),然后基于某种映射函数,将待排序序列的元素映射到第i个桶中,再对每个桶中的所有元素排序,最后合并。
1)确定元素的最大值max、最小值min、数组长度length;
2)确定桶数:n = (max - min) / length + 1;
3)确定桶的编号:0 ~ (n - 1);
4)确定数组元素对应的桶的编号:index = (x - min) / length;
5)对每个桶进行排序;
6)合并所有桶的元素。
PHP代码如下:
<?php
function bucketSort($arr) {
    $length = count($arr);
    $min = min($arr);
    $max = max($arr);
    $n = ceil(($max - $min) / $length) + 1;
    // 设置木桶
    $buckets = [];
    for ($i = 0; $i < $n; $i++) {
        $buckets[$i] = [];
    }
    // 将每个元素放入桶
    for ($i = 0; $i < $length; $i++) {
        $index = ceil(($arr[$i] - $min) / $length);
        $buckets[$index][] = $arr[$i];
    }
    // 对每个桶进行排序
    $res = [];
    for ($i = 0; $i < $n; $i++) {
        sort($buckets[$i]);
        // 合并所有桶中的元素
        $res = array_merge($res, $buckets[$i]);
    }
    return $res;
}
$arr = [12, 31, 85, 7, 41, 34, 10, 96];
$res = bucketSort($arr);
print_r($res);
这种方法,只需要设置12个桶即可,大大的节省了空间。

数据结构与算法之PHP排序算法(桶排序)的更多相关文章

  1. 算法笔记(c++)--桶排序题目

    算法笔记(c++)--桶排序 记得题目是排序,输入n个1-1000的数字然后去重然后排序. 桶排序没毛病 #include<iostream> using namespace std; i ...

  2. 计数排序和桶排序(Java实现)

    目录 比较和非比较的区别 计数排序 计数排序适用数据范围 过程分析 桶排序 网络流传桶排序算法勘误 桶排序适用数据范围 过程分析 比较和非比较的区别 常见的快速排序.归并排序.堆排序.冒泡排序等属于比 ...

  3. 计数排序与桶排序python实现

    计数排序与桶排序python实现 计数排序 计数排序原理: 找到给定序列的最小值与最大值 创建一个长度为最大值-最小值+1的数组,初始化都为0 然后遍历原序列,并为数组中索引为当前值-最小值的值+1 ...

  4. 【JS面试向】选择排序、桶排序、冒泡排序和快速排序简介

    新年伊始,又到了金三银四的时候了.面对前端越来越多的算法面试题,我简单的整理了一下几种比较常见的数组排序方式,分别介绍其基本原理和优劣势.(ps:才疏学浅,希望大家可以在issues下面指出问题) 选 ...

  5. 计数排序与桶排序(bucket sort)

    Bucket Sort is a sorting method that subdivides the given data into various buckets depending on cer ...

  6. 计数排序、桶排序python实现

    计数排序在输入n个0到k之间的整数时,时间复杂度最好情况下为O(n+k),最坏情况下为O(n+k),平均情况为O(n+k),空间复杂度为O(n+k),计数排序是稳定的排序. 桶排序在输入N个数据有M个 ...

  7. Java基础知识强化51:经典排序之桶排序(BucketSort)

    1. 首先说明三点: (1)桶排序是稳定的 (2)桶排序是常见排序里最快的一种,比快排还要快…大多数情况下 (3)桶排序非常快,但是同时也非常耗空间,基本上是最耗空间的一种排序算法 2. 桶排序的分析 ...

  8. java-数组排序--计数排序、桶排序、基数排序

    计数排序引入 不难发现不论是冒泡排序还是插入排序,其排序方法都是通过对每一个数进行两两比较进行排序的,这种方法称为比较排序,实际上对每个数的两两比较严重影响了其效率,理论上比较排序时间复杂度的最低下限 ...

  9. 排序基础之非比较的计数排序、桶排序、基数排序(Java实现)

    转载请注明原文地址: http://www.cnblogs.com/ygj0930/p/6639353.html  比较和非比较排序 快速排序.归并排序.堆排序.冒泡排序等比较排序,每个数都必须和其他 ...

  10. 排序:桶排序Bucket sort

    补充说明三点 1,桶排序是稳定的 2,桶排序是常见排序里最快的一种,比快排还要快…大多数情况下 3,桶排序非常快,但是同时也非常耗空间,基本上是最耗空间的一种排序算法 无序数组有个要求,就是成员隶属于 ...

随机推荐

  1. Git 教程(三):仓库与分支

    远程仓库 到目前为止,我们已经掌握了如何在Git仓库里对一个文件进行时光穿梭,你再也不用担心文件备份或者丢失的问题了. 可是有用过集中式版本控制系统SVN的童鞋会站出来说,这些功能在SVN里早就有了, ...

  2. 语音活性检测器py-webrtcvad安装使用

    谷歌为WebRTC项目开发的VAD是目前最优秀.最先进和免费的产品之一.webrtcvad是WebRTC语音活动检测器(VAD)的python接口.兼容python2和python3.功能是将一段音频 ...

  3. 20175208 张家华 MyCP

    一.内容 编写MyCP.java 实现类似Linux下cp XXX1 XXX2的功能,要求MyCP支持两个参数: java MyCP -tx XXX1.txt XXX2.bin 用来把文本文件(内容为 ...

  4. C博客作业06--结构体&文件

    1.本章学习总结 1.1思维导图 1.2本章学习体会 学习了结构和文件,又是懵懵的课了,我的天啊.结构还好,题目集一出就做了,不是很难,感觉掌握的还可以,不过这只是感觉而已,等到真正来写大作业的时候又 ...

  5. 介绍Kubernetes监控Heapster

    什么是Heapster? Heapster是容器集群监控和性能分析工具,天然的支持Kubernetes和CoreOS,Kubernetes有个出名的监控agent—cAdvisor.在每个kubern ...

  6. 软件测试实验四----mujava变异测试

    1.整个路径结构 2.具体内容 2.1mujava的安装 2.1.1更改CLASSPATH环境变量,使命令行可以找到mujava的路径,方便之后mujava的使用. 2.1.2在系统某一路径下按照格式 ...

  7. 初步了解,vue的转发机制(proxyTable)

    vue的转发机制(proxyTable),proxyTable代理功能可以实现转发机制,需要修改config里面修改index.js文件 修改index.vue中请求的代码(该功能是webpack-s ...

  8. php中time()与$_SERVER[REQUEST_TIME]用法区别

    简单的说time()与$_SERVER["REQUEST_TIME"]都是获得时间的,但time返回当前的 Unix 时间戳而$_SERVER["REQUEST_TIME ...

  9. python3之platform模块

    platform模块可以获取操作系统的相关信息. >>> platform.system() #获取系统名称 'Linux' >>> platform.archit ...

  10. 网站搭建 (第06天) Ckeditor编辑器

    一.前言 富文本编辑器,Rich Text Editor, 简称 RTE, 是一种可内嵌于浏览器,所见即所得的文本编辑器,这是百度百科的对富文本编辑器的解释.我们可以借助富文本编辑器,编辑出来一个包含 ...