优秀的编程知识分享平台

网站首页 > 技术文章 正文

一文搞定所有排序算法

nanyue 2025-01-16 20:22:06 技术文章 2 ℃

排序算法概述

1. 冒泡排序

2. 选择排序

3. 插入排序

4. 希尔排序

5. 归并排序

6. 快速排序

7. 堆排序

8. 计数排序

9. 桶排序

10. 基数排序


排序算法概述

数列排序是算法领域中一个使用频率很高的算法类型;数据结构和算法(Java)中,包含下列不同类型的排序算法,本文逐一予以介绍。

不同排序算法的对比,直接上图:

图中概念说明:

  • n: 数据规模
  • k: “桶”的个数
  • In-place: 占用常数内存,不占用额外内存
  • Out-place: 占用额外内存
  • 稳定:如果a原本在b前面,而a=b,排序之后a仍然在b的前面;
  • 不稳定:如果a原本在b的前面,而a=b,排序之后a可能会出现在b的后面;
  • 内排序:所有排序操作都在内存中完成;
  • 外排序:由于数据太大,因此把数据放在磁盘中,而排序通过磁盘和内存的数据传输才能进行;
  • 时间复杂度: 一个算法执行所耗费的时间。
  • 空间复杂度:运行完一个程序所需内存的大小。


比较排序&非比较排序

  • 比较排序:常见的快速排序、归并排序、堆排序、冒泡排序;在排序的最终结果里,元素之间的次序依赖于它们之间的比较。每个数都必须和其他数进行比较,才能确定自己的位置。
  • 非比较排序:计数排序、基数排序、桶排序。非比较排序只要确定每个元素之前的已有的元素个数即可,所有一次遍历即可解决。算法时间复杂度O(n)。
  • 插入排序:直接插入排序、希尔排序;


基数排序 & 计数排序 & 桶排序

这三种排序算法都利用了桶的概念,但对桶的使用方法上有明显差异:

  • 基数排序:根据键值的每位数字来分配桶
  • 计数排序:每个桶只存储单一键值
  • 桶排序:每个桶存储一定范围的数值


1、冒泡排序(Bubble Sort)

冒泡排序是一种简单的排序算法。这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端。

1.1 算法工作原理:

  • ij两层循环,一次j内侧循环过程,实现将最大元素逐渐交换(先比较)到数列尾部;与此同时实现,较小元素不断向前冒泡。
  • i外侧循环完后,从数列尾部向前的所有位置均存储了(0-i)区间内的最大值,实现数列全部排序。

1.2 算法实现:

public static int[] bubbleSort(int[] array) {
   if (array.length == 0)
       return array;
   for (int i = 0; i < array.length; i++)
       for (int j = 0; j < array.length - 1 - i; j++)
           if (array[j + 1] < array[j]) {//不断比较交换,实现最大值沉底(到数列尾部)
               int temp = array[j + 1];
               array[j + 1] = array[j];
               array[j] = temp;
           }
   return array;
}


2、选择排序(Selection Sort)

选择排序(Selection-sort)是一种简单直观的排序算法。也是O(n2)的时间复杂度,依次把后面剩余区间内遍历到的最小值交换到数列前面。


2.1 算法工作原理:

  • ij两层循环,一次j内侧循环,将比较记录下来的最小数交换到i位置(数列头部)。
  • i外侧循环完后,从数列头部向后的所有位置依次均存储了数列剩余区间的最小值,最终实现数列全部排序。


2.2 算法实现:

public static int[] selectionSort(int[] array) {
   if (array.length == 0)
       return array;
   for (int i = 0; i < array.length; i++) {
       int minIndex = i;
       for (int j = i; j < array.length; j++) {
           if (array[j] < array[minIndex]) 
               minIndex = j; //保存最小数的index
       }
       int temp = array[minIndex];
       array[minIndex] = array[i];
       array[i] = temp;
   }
   return array;
}

3、插入排序(Insertion Sort)

插入排序,则通过不断构建+1的有序序列,对于未排序的后面数据,在已排序序列中从后向前扫描,找到相应位置并动态插入。

3.1 算法工作原理:

  • 0-i 已为有序数列,i+1数列元素为待插入的元素。
  • 从i->0向前比较找到i+1待插入元素的位置index,并依次向后挪出空位置。

3.2 算法实现:

public static int[] insertionSort(int[] array) {
   if (array.length == 0)
       return array;
   int current;
   for (int i = 0; i < array.length - 1; i++) {
       current = array[i + 1]; //待插入的元素
       int preIndex = i;
       while (preIndex >= 0 && current < array[preIndex]) { //已排序数列段中,找到待插入元素的index位置并向后挪位
           array[preIndex + 1] = array[preIndex];
           preIndex--;
       }
       array[preIndex + 1] = current; //插入元素
   }
   return array;
}


4、希尔排序(Shell Sort)

希尔排序(Shell's Sort)是插入排序的一种又称“缩小增量排序”(Diminishing Increment Sort),是直接插入排序算法的一种更高效的改进版本。希尔排序是非稳定排序算法。该方法因D.L.Shell于1959年提出而得名。

希尔排序是把记录按下标的一定增量分组,对每组使用直接插入排序算法排序;随着增量逐渐减少,每组包含的关键词越来越多,当增量减至1时,整个文件恰被分成一组,算法便终止。


4.1 算法工作原理:

我们来看下希尔排序的基本步骤,在此我们选择增量gap=length/2,缩小增量继续以gap = gap/2的方式,这种增量选择我们可以用一个序列来表示,{n/2,(n/2)/2...1},称为增量序列。希尔排序的增量序列的选择与证明是个数学难题,我们选择的这个增量序列是比较常用的,也是希尔建议的增量,称为希尔增量,但其实这个增量序列不是最优的。

具体算法描述:

  • 先取一个正整数d1<n,把所有序号相隔d1的数组元素放一组,组内进行直接插入排序;
  • 然后取d2<d1,重复上述分组和排序操作;直至di=1,即所有记录放进一个组中排序为止。

4.2 算法实现:

public static int[] ShellSort(int[] array) {
   int len = array.length;
   int temp, gap = len / 2; //增量默认值,可定义为length/2
   while (gap > 0) {
       for (int i = gap; i < len; i++) { //这个循环里其实就是一个插入排序            
           temp = array[i];
           int preIndex = i - gap;
           while (preIndex >= 0 && array[preIndex] > temp) {
               array[preIndex + gap] = array[preIndex];
               preIndex -= gap;
           }
           array[preIndex + gap] = temp;
       }
       gap /= 2;//增量每次减半
   }
   return array;
}


5、归并排序(Merge Sort)

归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法。该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。

将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。归并排序是一种稳定的排序方法。

5.1 算法工作原理:

  • 把长度为n的输入序列分成两个长度为n/2的子序列;
  • 对这两个子序列分别采用归并排序;
  • 将两个排序好的子序列合并成一个最终的排序序列。

5.2 算法实现:

public static int[] MergeSort(int[] array) {
   if (array.length < 2) return array;
   int mid = array.length / 2;
   int[] left = Arrays.copyOfRange(array, 0, mid);
   int[] right = Arrays.copyOfRange(array, mid, array.length);
   return merge(MergeSort(left), MergeSort(right));
}
/**
* 将两段排序好的数组结合成一个排序数组
*/
public static int[] merge(int[] left, int[] right) {
   int[] result = new int[left.length + right.length];
   for (int index = 0, i = 0, j = 0; index < result.length; index++) {
       if (i >= left.length)
           result[index] = right[j++];
       else if (j >= right.length)
           result[index] = left[i++];
       else if (left[i] > right[j])
           result[index] = right[j++];
       else
           result[index] = left[i++];
   }
   return result;
}

6、快速排序(Quick Sort)

快速排序(Quicksort)是对冒泡排序的一种改进,快速排序由C. A. R. Hoare在1960年提出。

基本思想是:通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。


6.1 算法工作原理:

快速排序使用分治法来把一个串(list)分为两个子串(sub-lists)。具体算法描述如下:

  • 从数列中挑出一个元素,称为 “基准”(pivot);
  • 重新排序数列,所有元素比基准值小的摆放在基准前面,所有元素比基准值大的摆在基准的后面(相同的数可以到任一边)。在这个分区退出之后,该基准就处于数列的中间位置。这个称为分区(partition)操作;
  • 递归地(recursive)把小于基准值元素的子数列和大于基准值元素的子数列排序。

6.2 算法实现

public static int[] QuickSort(int[] array, int start, int end) {
   if (array.length < 1 || start < 0 || end >= array.length || start > end) return null;
   int smallIndex = partition(array, start, end);
   if (smallIndex > start)
       QuickSort(array, start, smallIndex - 1);
   if (smallIndex < end)
       QuickSort(array, smallIndex + 1, end);
   return array;
}

public static int partition(int[] array, int start, int end) {
   int pivot = (int) (start + Math.random() * (end - start + 1));
   int smallIndex = start - 1;
   swap(array, pivot, end);
   for (int i = start; i <= end; i++)
       if (array[i] <= array[end]) {
           smallIndex++;
           if (i > smallIndex)
               swap(array, i, smallIndex);
       }
   return smallIndex;
}

/**
* 交换数组内两个元素(根据下标index)
*/
public static void swap(int[] array, int i, int j) {
   int temp = array[i];
   array[i] = array[j];
   array[j] = temp;
}


7、堆排序(Heap Sort)

堆排序(英语:Heapsort)是指利用堆这种数据结构所设计的一种排序算法。堆是一个近似完全二叉树的结构,并同时满足堆积的性质:即子结点的键值或索引总是小于(或者大于)它的父节点。

7.1 算法工作原理:

  • 将初始待排序关键字序列(R1,R2….Rn)构建成大顶堆,此堆为初始的无序区;
  • 将堆顶元素R[1]与最后一个元素R[n]交换,此时得到新的无序区(R1,R2,……Rn-1)和新的有序区(Rn),且满足R[1,2…n-1]<=R[n];
  • 由于交换后新的堆顶R[1]可能违反堆的性质,因此需要对当前无序区(R1,R2,……Rn-1)调整为新堆,然后再次将R[1]与无序区最后一个元素交换,得到新的无序区(R1,R2….Rn-2)和新的有序区(Rn-1,Rn)。不断重复此过程直到有序区的元素个数为n-1,则整个排序过程完成。


7.2 算法实现

注意:这里用到了完全二叉树的部分性质。

static int len;
/**
* 选择排序-堆排序
*
* @param array 待排序数组
* @return 已排序数组
*/
public static int[] HeapSort(int[] array) {
   len = array.length;
   if (len < 1) return array;
   //1.构建一个最大堆
   buildMaxHeap(array);
   //2.循环将堆首位(最大值)与末位交换,然后在重新调整最大堆
   while (len > 0) {
       swap(array, 0, len - 1);
       len--;
       adjustHeap(array, 0);
   }
   return array;
}
/**
* 建立最大堆
*/
public static void buildMaxHeap(int[] array) {
   //从最后一个非叶子节点开始向上构造最大堆
   for (int i = (len - 1) / 2; i >= 0; i--) {
       adjustHeap(array, i);
   }
}
/**
* 调整使之成为最大堆
*/
public static void adjustHeap(int[] array, int i) {
   int maxIndex = i;
   //如果有左子树,且左子树大于父节点,则将最大指针指向左子树
   if (i * 2 < len && array[i * 2] > array[maxIndex])
       maxIndex = i * 2;
   //如果有右子树,且右子树大于父节点,则将最大指针指向右子树
   if (i * 2 + 1 < len && array[i * 2 + 1] > array[maxIndex])
       maxIndex = i * 2 + 1;
   //如果父节点不是最大值,则将父节点与最大值交换,并且递归调整与父节点交换的位置。
   if (maxIndex != i) {
       swap(array, maxIndex, i);
       adjustHeap(array, maxIndex);
   }
}


8、计数排序(Counting Sort)

计数排序的核心在于将输入的数据值转化为键存储在额外开辟的数组空间中。 作为一种线性时间复杂度的排序,计数排序要求输入的数据必须是有确定范围的整数。

计数排序(Counting sort)是一种稳定的排序算法。计数排序使用一个额外的数组C,其中第i个元素是待排序数组A中值等于i的元素的个数。然后根据数组C来将A中的元素排到正确的位置。它只能对整数进行排序。

8.1 算法工作原理:

  • 找出待排序的数组中最大和最小的元素;
  • 统计数组中每个值为i的元素出现的次数,存入数组C的第i项;
  • 对所有的计数累加(从C中的第一个元素开始,每一项和前一项相加);
  • 反向填充目标数组:将每个元素i放在新数组的第C(i)项,每放一个元素就将C(i)减去1。

8.2 代码实现

public static int[] CountingSort(int[] array) {
   if (array.length == 0) return array;
   int bias, min = array[0], max = array[0];
   for (int i = 1; i < array.length; i++) {
       if (array[i] > max)
           max = array[i];
       if (array[i] < min)
           min = array[i];
   }
   bias = 0 - min;
   int[] bucket = new int[max - min + 1];
   Arrays.fill(bucket, 0);
   for (int i = 0; i < array.length; i++) {
       bucket[array[i] + bias]++;
   }
   int index = 0, i = 0;
   while (index < array.length) {
       if (bucket[i] != 0) {
           array[index] = i - bias;
           bucket[i]--;
           index++;
       } else
           i++;
   }
   return array;
}


9、桶排序(Bucket Sort)

桶排序是计数排序的升级版。它利用了函数的映射关系,高效与否的关键就在于这个映射函数的确定。

桶排序 (Bucket sort)的工作的原理:假设输入数据服从均匀分布,将数据分到有限数量的桶里,每个桶再分别排序(有可能再使用别的排序算法或是以递归方式继续使用桶排序进行排。

9.1 算法工作原理

  • 人为设置一个BucketSize,作为每个桶所能放置多少个不同数值(例如当BucketSize==5时,该桶可以存放{1,2,3,4,5}这几种数字,但是容量不限,即可以存放100个3);
  • 遍历输入数据,并且把数据一个一个放到对应的桶里去;
  • 对每个不是空的桶进行排序,可以使用其它排序方法,也可以递归使用桶排序;
  • 从不是空的桶里把排好序的数据拼接起来。

注意,如果递归使用桶排序为各个桶排序,则当桶数量为1时要手动减小BucketSize增加下一循环桶的数量,否则会陷入死循环,导致内存溢出。

9.2 代码实现

public static ArrayList<Integer> BucketSort(ArrayList<Integer> array, int bucketSize) {
   if (array == null || array.size() < 2)
       return array;
   int max = array.get(0), min = array.get(0);
   // 找到最大值最小值
   for (int i = 0; i < array.size(); i++) {
       if (array.get(i) > max)
           max = array.get(i);
       if (array.get(i) < min)
           min = array.get(i);
   }
   int bucketCount = (max - min) / bucketSize + 1;
   ArrayList<ArrayList<Integer>> bucketArr = new ArrayList<>(bucketCount);
   ArrayList<Integer> resultArr = new ArrayList<>();
   for (int i = 0; i < bucketCount; i++) {
       bucketArr.add(new ArrayList<Integer>());
   }
   for (int i = 0; i < array.size(); i++) {
       bucketArr.get((array.get(i) - min) / bucketSize).add(array.get(i));
   }
   for (int i = 0; i < bucketCount; i++) {
       if (bucketCount == 1)
           bucketSize--;
       ArrayList<Integer> temp = BucketSort(bucketArr.get(i), bucketSize);
       for (int j = 0; j < temp.size(); j++)
           resultArr.add(temp.get(j));
   }
   return resultArr;
}


10、基数排序(Radix Sort)

基数排序也是非比较的排序算法,对每一位进行排序,从最低位开始排序,复杂度为O(kn),为数组长度,k为数组中的数的最大的位数;

基数排序是按照低位先排序,然后收集;再按照高位排序,然后再收集;依次类推,直到最高位。有时候有些属性是有优先级顺序的,先按低优先级排序,再按高优先级排序。最后的次序就是高优先级高的在前,高优先级相同的低优先级高的在前。基数排序基于分别排序,分别收集,所以是稳定的。

10.1 算法工作原理

  • 取得数组中的最大数,并取得位数;
  • arr为原始数组,从最低位开始取每个位组成radix数组;
  • 对radix进行计数排序(利用计数排序适用于小范围数的特点);

10.2 代码实现

public static int[] RadixSort(int[] array) {
   if (array == null || array.length < 2)
       return array;
   // 1.先算出最大数的位数;
   int max = array[0];
   for (int i = 1; i < array.length; i++) {
       max = Math.max(max, array[i]);
   }
   int maxDigit = 0;
   while (max != 0) {
       max /= 10;
       maxDigit++;
   }
   int mod = 10, div = 1;
   ArrayList<ArrayList<Integer>> bucketList = new ArrayList<ArrayList<Integer>>();
   for (int i = 0; i < 10; i++)
       bucketList.add(new ArrayList<Integer>());
   for (int i = 0; i < maxDigit; i++, mod *= 10, div *= 10) {
       for (int j = 0; j < array.length; j++) {
           int num = (array[j] % mod) / div;
           bucketList.get(num).add(array[j]);
       }
       int index = 0;
       for (int j = 0; j < bucketList.size(); j++) {
           for (int k = 0; k < bucketList.get(j).size(); k++)
               array[index++] = bucketList.get(j).get(k);
           bucketList.get(j).clear();
       }
   }
   return array;
}

部分资料摘自网络资源,如涉及版权问题,请私信联系删除。

关注头条号“编程家园”,后续陆续会有更多技术领域(包括并不限于Android进阶、Java进阶、Koltin、网络、算法、数据库、架构、Flutter、Python等),职业规划、职业思考等方面资料的免费分享,期待您的关注!

最近发表
标签列表