排序算法
(重定向自Sorting algorithm)
此條目没有列出任何参考或来源。 (2013年11月10日) |
在計算機科學與數學中,一個排序算法(英語:Sorting algorithm)是一種能將一串資料依照特定排序方式排列的算法,排序後的資料即可放在有序陣列。最常用到的排序方式是數值順序以及字典順序。有效的排序算法在一些算法(例如搜尋算法與合併算法)中是重要的,如此這些算法才能得到正確解答。排序算法也用在處理文字資料以及產生人類可讀的輸出結果。基本上,排序算法的輸出必須遵守下列兩個原則:
- 輸出結果為遞增序列(遞增是針對所需的排序順序而言)
- 輸出結果是原輸入的一種排列、或是重組
雖然排序算法是一個簡單的問題,但是從計算機科學發展以來,在此問題上已經有大量的研究。舉例而言,泡沫排序在1956年就已經被研究。雖然大部分人認為這是一個已經被解決的問題,有用的新算法仍在不斷的被發明。(例子:圖書館排序在2004年被發表)
分類[编辑]
在计算机科学所使用的排序算法通常依以下標準分類:
- 計算的時間複雜度(最差、平均、和最好性能),依據串列(list)的大小(<math>n</math>)。一般而言,好的性能是<math>O(n\log n)</math>(大O符号),壞的性能是<math>O(n^2)</math>。對於基於比較的排序,存在 <math>\Omega(n\log n)</math>的下界;而在鍵值範圍受限等條件下,非比較排序可達到線性時間。基於比較的排序算法對大多數輸入而言至少需要<math>O(n\log n)</math>。
- 内存使用量(以及其他電腦資源的使用)
- 穩定性:穩定排序算法會讓原本有相等鍵值的紀錄維持相對次序。也就是如果一個排序算法是穩定的,當有兩個相等鍵值的紀錄<math>R</math>和<math>S</math>,且在原本的串列中<math>R</math>出現在<math>S</math>之前,在排序過的串列中<math>R</math>也將會是在<math>S</math>之前。
- 排序的方法:插入、交換、選擇、合併等等。
穩定性[编辑]
當相等的元素是無法分辨的,比如像是整數,穩定性並不是一個問題。然而,假設以下的數對將要以他們的第一個數字來排序。
<math>(4, 1) (3, 1) (3, 7) (5, 6)</math>
在這個狀況下,有可能產生兩種不同的結果,一個是讓相等鍵值的紀錄維持相對的次序,而另外一個則沒有:
<math>(3, 1) (3, 7) (4, 1) (5, 6) </math> (維持次序) <math>(3, 7) (3, 1) (4, 1) (5, 6) </math> (次序被改變)
不穩定排序算法可能會在相等的鍵值中改變紀錄的相對次序,但是穩定排序算法從來不會如此。不穩定排序算法可以被特別地實作為穩定。作這件事情的一個方式是人工擴充鍵值的比較,如此在其他方面相同鍵值的兩個物件間之比較,(比如上面的比较中加入第二个标准:第二个键值的大小)就會被決定使用在原先資料次序中的條目,當作一個同分決賽。然而,要記住這種次序通常牽涉到額外的空間負擔。
排序算法列表[编辑]
在這個表格中,<math>n</math>是要被排序的紀錄數量以及<math>k</math>是不同鍵值的數量。
穩定的排序[编辑]
- 冒泡排序(bubble sort)— <math>O(n^2)</math>
- 插入排序(insertion sort)—<math>O(n^2)</math>
- 鸡尾酒排序(cocktail sort)—<math>O(n^2)</math>
- 桶排序(bucket sort)—<math>O(n)</math>;需要<math>O(k)</math>額外空間
- 计数排序(counting sort)—<math>O(n+k)</math>;需要<math>O(n+k)</math>額外空間
- 归并排序(merge sort)—<math>O(n\log n)</math>;需要<math>O(n)</math>額外空間
- 原地归并排序— <math>O(n\log^2 n)</math>如果使用最佳的現在版本
- 二叉排序树排序(binary tree sort)— <math>O(n\log n)</math>期望时间;<math>O(n^2)</math>最坏时间;需要<math>O(n)</math>額外空間
- 鸽巢排序(pigeonhole sort)—<math>O(n+k)</math>;需要<math>O(k)</math>額外空間
- 基數排序(radix sort)—<math>O(nk)</math>;需要<math>O(n)</math>額外空間
- 侏儒排序(gnome sort)— <math>O(n^2)</math>
- 圖書館排序(library sort)— <math>O(n\log n)</math>期望时间;<math>O(n^2)</math>最坏时间;需要<math>(1+\varepsilon)n</math>額外空間
- 塊排序(block sort)— <math>O(n\log n)</math>
- Tim排序(Timsort)—<math>O(n\log n)</math>平均、最坏时间;<math>O(n)</math>最优时间;需要<math>O(n)</math>額外空間;是目前已知最快的排序算法,在Python、Swift、Rust等语言的内置排序功能中被用作默认算法
不穩定的排序[编辑]
- 選擇排序(selection sort)—<math>O(n^2)</math>
- 希爾排序(shell sort)—<math>O(n\log^2 n)</math>如果使用最佳的現在版本
- 克洛弗排序(Clover sort)—<math>O(n)</math>期望时间,<math>O(n^2)</math>最坏情况[來源請求]
- 梳排序— <math>O(n\log n)</math>
- 堆排序(heap sort)—<math>O(n\log n)</math>
- 平滑排序(smooth sort)— <math>O(n\log n)</math>
- 快速排序(quick sort)—<math>O(n\log n)</math>期望時間,<math>O(n^2)</math>最壞情況
- 內省排序(introsort)—<math>O(n\log n)</math>
- 耐心排序(patience sort)—<math>O(n\log n+k)</math>最坏情況時間,需要額外的<math>O(n+k)</math>空間,也需要找到最長的遞增子序列(longest increasing subsequence)
不實用的排序[编辑]
- Bogo排序— <math>O(n \times n!)</math>,最壞的情況下期望時間為無窮。
- Stupid排序—<math>O(n^3)</math>;遞迴版本需要<math>O(n^2)</math>額外記憶體
- 珠排序(bead sort)— <math>O(n)</math> 或 <math>O(\sqrt{n})</math>,但需要特別的硬體
- 煎餅排序—<math>O(n)</math>,但需要特別的硬體
- 臭皮匠排序(stooge sort)算法简单,但需要约<math>n^{2.7}</math>的时间
简要比较[编辑]
| 名称 | 数据对象 | 稳定性 | 时间复杂度 | 額外空间复杂度 | 描述 | |
|---|---|---|---|---|---|---|
| 平均 | 最坏 | |||||
| 冒泡排序 | 数组 | File:Yes check.svg | <math>O(n^2)</math> | <math>O(1)</math> | (无序区,有序区)。 從无序区透過交換找出最大元素放到有序区前端。 | |
| 选择排序 | 数组 | File:X mark.svg | <math>O(n^2)</math> | <math>O(1)</math> | (有序区,无序区)。 在无序区里找一个最小的元素跟在有序区的后面。对数组:比较得多,换得少。 | |
| 链表 | File:Yes check.svg | |||||
| 插入排序 | 数组、链表 | File:Yes check.svg | <math>O(n^2)</math> | <math>O(1)</math> | (有序区,无序区)。 把无序区的第一个元素插入到有序区的合适的位置。对数组:比较得少,换得多。 | |
| 堆排序 | 数组 | File:X mark.svg | <math> O(n\log n)</math> | <math>O(1)</math> | (最大堆,有序区)。 从堆顶把根卸出来放在有序区之前,再恢复堆。 | |
| 归并排序 | 数组 | File:Yes check.svg | <math> O(n\log^2 n)</math> | <math>O(1) </math> | 把数据分为两段,从两段中逐个选最小的元素移入新数据段的末尾。 可从上到下或从下到上进行。 | |
| <math> O(n\log n)</math> | <math>O(n) +O(\log n) </math> 如果不是从下到上 | |||||
| 链表 | <math> O(1)</math> | |||||
| 快速排序 | 数组 | File:X mark.svg | <math>O(n\log n) </math> | <math>O(n^2)</math> | <math>O(\log n)</math> | (小数,基准元素,大数)。 在区间中随机挑选一个元素作基准,将小于基准的元素放在基准之前,大于基准的元素放在基准之后,再分别对小数区与大数区进行排序。 |
| 链表 | File:Yes check.svg | |||||
| 希爾排序 | 数组 | File:X mark.svg | <math>O(n\log^2n) </math> | <math>O(n^2)</math> | <math>O(1)</math> | 每一輪按照事先決定的間隔進行插入排序,間隔會依次縮小,最後一次一定要是1。 |
| 计数排序 | 数组、链表 | File:Yes check.svg | <math>O(n+m)</math> | <math>O(n+m)</math> | 统计小于等于该元素值的元素的个数i,于是该元素就放在目标数组的索引i位(i≥0)。 | |
| 桶排序 | 数组、链表 | File:Yes check.svg | <math>O(n)</math> | <math>O(n^2)</math> | <math>O(m)</math> | 将值为i的元素放入i号桶,最后依次把桶里的元素倒出来。 |
| 基数排序 | 数组、链表 | File:Yes check.svg | <math>O(k\times n)</math> | <math>O(n^2)</math> | 一种多关键字的排序算法,可用桶排序实现。 | |
- 均按从小到大排列
- k代表数值中的"数位"个数
- n代表数据规模
- m代表数据的最大值减最小值