但凡学习过数据结构和算法的人都了解排序算法。我也是,常常扯上两句,好像说得头头是道,但是一动手写代码就漏洞百出了。尤其最近深感排序算法的重要性,所以下定决心要好好把排序算法彻底弄清楚。
首先说个最简单的冒泡排序。由于它的简洁,冒泡排序通常作为第一个排序算法介绍给入门级的学生。
冒泡排序的思想:
冒泡排序(Bubble Sort,台湾译为:泡沫排序或气泡排序)是一种简单的排序算法。它重复地走访过要排序的数列,一次比较两个元素,如果它们的顺序错误就把它们交换过来。走访数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端。
冒泡排序是稳定的排序。
冒泡排序的复杂度:
冒泡排序对n个项目需要O()的比较次数,且可以原地排序,而且它是稳定排序。尽管这个算法最简单,但它对于少数元素之外的数列排序是很没有效率的。
冒泡排序是与插入排序拥有相等的执行时间,但是两种算法在需要的交换次数却有很大的不同。在最坏的情况,冒泡排序需要次交换,而插入排序只要最多次交换。冒泡排序的实现通常会对已经排序好的数列拙劣地执行(),而插入排序同样情况可能只需要个运算。因此很多现代的算法教科书避免使用冒泡排序,而用插入排序取代之。冒泡排序如果能在内部循环第一次执行时,使用一个旗标来表示有无需要交换的可能,也有可能把最好的复杂度降低到。在这个情况,在已经排序好的数列就无交换的需要。若在每次走访数列时,把走访顺序和比较大小反过来,也可以稍微地改进效率。有时候称为往返排序,因为算法会从数列的一端到另一端之间穿梭往返。
在空间上,冒泡排序只需要额外的O(1)的空间进行数据交换。
小结:
冒泡排序算法的运作如下:
public int[] bubbleSort(int[] arr) { if(arr==null) return arr; int len = arr.length; for(int i=len; i>0; i--) { for(int j=0; j<i-1; j++) { if(arr[j]>arr[j+1]) { int temp = arr[j]; arr[j] = arr[j+1]; arr[j+1] = temp; } } } return arr; }
上面是我第一次根据冒泡思想写的程序,大家看一下有什么问题。
其实上面的代码执行时结果是正确的,但有两个细节做的不太好。
综上所述,我们将代码修改如下:
public int[] bubbleSort(int[] arr) { if(arr!=null) { int len = arr.length; for(int i=len-1; i>0; --i) { for(int j=0; j<i; ++j) { if(arr[j]>arr[j+1]) { int temp = arr[j]; arr[j] = arr[j+1]; arr[j+1] = temp; } } } } return arr; }
上面是java代码,下面再增加一段标准c语言的写法吧
#include <stdio.h> void bubbleSort(int arr[], int count) { int i = count, j; int temp; while(i > 0) { for(j = 0; j < i - 1; j++) { if(arr[j] > arr[j + 1]) { temp = arr[j]; arr[j] = arr[j + 1]; arr[j + 1] = temp; } } i--; } } int main(int arc, char* const argv[]) { //测试数据 int arr[] = {5, 4, 1, 3, 6}; //冒泡排序 bubbleSort(arr, 5); //打印排序结果 int i; for(i = 0; i < 5; i++) printf("%4d", arr[i]); }
如果大家只是想了解一下冒泡排序的思想及代码写法,那看到这里就可以结束了。如果想对冒泡排序有更多一点了解,那就接着往下看吧。
冒泡排序的核心就在两个for循环的处理上。我们上面的代码其实只实现一种写法。维基百科上用助记码的方式给出了三种方案。
对应的代码如下:
for(i = 0; i < count - 1; i++) { for(j = 0; j < count - 1 - i; j++) { if(cmp(arr[j], arr[j+1]) > 0) { temp = arr[j]; arr[j] = arr[j+1]; arr[j+1] = temp; } } }
for(i = count - 1; i > 0; i--) { for(j = count - 1; j > count - 1 - i; j--) { if(cmp(arr[j-1], arr[j]) > 0) { temp = arr[j]; arr[j] = arr[j-1]; arr[j-1] = temp; } } }
for(i = 0; i < count-1; i++) { for(j = i+1; j < count; j++) { if(cmp(arr[i], arr[j]) > 0) { temp = arr[j]; arr[j] = arr[i]; arr[i] = temp; } } }
上面我们已经分析过,冒泡排序的交换次数过多,所以效率不好。其实仔细观察发现,每一趟排序都会把最大值放到序列的末端,因此只需要将最大值交换到序列末端即可,中间的那些多次交换是不必要的。因此算法可以进行简单的改进:
for(right = count-1; right > 0; right --) { for(i = 1, max = 0; i < right; i++) { if(cmp(arr[i], arr[max]) > 0) { max = i; } } if(cmp(arr[max], arr[right]) > 0) { temp = arr[max]; arr[max] = arr[right]; arr[right] = temp; } }
不过注意,这样修改之后的冒泡排序就不再是稳定排序了。需要注意的是,排序算法是否为稳定的是由具体算法决定的,不稳定的算法在某种条件下可以变为稳定的算法,而稳定的算法在某种条件下也可以变为不稳定的算法。
另外,我们在时间复杂度分析的时候也了解到,有时序列已经排列好了,但是冒泡排序还在重复地遍历,而这时的遍历是不必要的。我们设想一下,如果在当前这趟遍历时,没有元素发生交换,那就说明排序已经完成,因此后面就不需要再进行排序了。通过设置标记或旗帜的方法来改进的思路如下:
#include <iostream> using namespace std; void bubble_sort(int d[], int size) { //#假定两两交换发生在数组最后的两个位置#% int exchange = size - 1; while(exchange) { //#记录下发生数据交换的位置#% int bound = exchange; exchange = 0; //#假定本趟比较没有数据交换#% for(int i = 0; i < bound; i++) { if (d[i] > d[i + 1]) { //#交换#% int t = d[i]; d[i] = d[i + 1]; d[i + 1] = t; exchange = i + 1; } } } } int main (int argc, char * const argv[]) { int a[] = {3, 5, 3, 6, 4, 7, 5, 7, 4}; //#QQ#% bubble_sort(a, sizeof(a) / sizeof(*a)); //#输出#% for(int i = 0; i < sizeof(a) / sizeof(*a); i++) cout << a[i] << ' '; cout << endl; return 0; }
读到这里,长吁一口气,冒泡排序的学习就先到这里吧。下次学习 插入排序。
参考资料:
1. 维基百科 排序算法
2. 维基百科 冒泡排序