Sortowanie

Wikipedia:Weryfikowalność
Ten artykuł należy dopracować:
od 2014-12 → zweryfikować treść i dodać przypisy,
od 2014-06 → dodać przypisy do treści niemających odnośników do źródeł.

Dokładniejsze informacje o tym, co należy poprawić, być może znajdują się w dyskusji tego artykułu.
Po wyeliminowaniu niedoskonałości należy usunąć szablon {{Dopracować}} z tego artykułu.

Sortowanie – jeden z podstawowych problemów informatyki, polegający na uporządkowaniu zbioru danych względem pewnych cech charakterystycznych każdego elementu tego zbioru[1]. Szczególnym przypadkiem jest sortowanie względem wartości każdego elementu, np. sortowanie liczb, słów itp.

Algorytmy sortowania są stosowane w celu uporządkowania danych, umożliwienia stosowania wydajniejszych algorytmów (np. wyszukiwania) i prezentacji danych w sposób czytelniejszy dla człowieka.

Jeśli jest konieczne posortowanie zbioru większego niż wielkość dostępnej pamięci, stosuje się algorytmy sortowania zewnętrznego.

Algorytmy, do działania których nie jest potrzebna większa niż stała pamięć dodatkowa (elementy sortowane przechowywane są przez cały czas w tablicy wejściowej), nazywane są algorytmami działającymi w miejscu[2].

Algorytmy sortujące, które dla elementów o tej samej wartości zachowują w tablicy końcowej kolejność tablicy wejściowej, nazywamy algorytmami stabilnymi[3].

Problem sortowania

Formalna definicja problemu sortowania[1]

Dane wejściowe: ciąg n {\displaystyle n} liczb a 0 , a 1 , a n . {\displaystyle \langle a_{0},a_{1},\dots a_{n}\rangle .}
Wynik: permutacja (zmiana uporządkowania) a 0 , a 1 , a n {\displaystyle \langle a'_{0},a'_{1},\dots a'_{n}\rangle } ciągu wejściowego taka, że a 0 a 1 a n . {\displaystyle a'_{0}\leqslant a'_{1}\leqslant \dots \leqslant a'_{n}.}

Klasyfikacja

Algorytmy sortowania są zazwyczaj klasyfikowane według[potrzebny przypis]:

  • złożoności (pesymistyczna, oczekiwana) – zależność liczby wykonanych operacji w stosunku od liczebności sortowanego zbioru ( n ) . {\displaystyle (n).} Typową, dobrą złożonością jest średnia O ( n log n ) {\displaystyle \mathrm {O} (n\log n)} i pesymistyczna Ω ( n 2 ) . {\displaystyle \Omega (n^{2}).} Idealną złożonością jest O ( n ) . {\displaystyle \mathrm {O} (n).} Algorytmy sortujące nie przyjmujące żadnych wstępnych założeń dla danych wejściowych wykonują co najmniej O ( n log n ) {\displaystyle \mathrm {O} (n\log n)} operacji w modelu obliczeń, w którym wartości są „przezroczyste” i dopuszczalne jest tylko ich porównywanie (w niektórych bardziej ograniczonych modelach istnieją asymptotycznie szybsze algorytmy sortowania);
  • złożoność pamięciowa
  • sposób działania: algorytmy sortujące za pomocą porównań to takie algorytmy sortowania, których sposób wyznaczania porządku jest oparty wyłącznie na wynikach porównań między elementami; Dla takich algorytmów dolne ograniczenie złożoności wynosi Ω ( n log n ) ; {\displaystyle \Omega (n\log n);}
  • stabilność: stabilne algorytmy sortowania utrzymują kolejność występowania dla elementów o tym samym kluczu (klucz – cecha charakterystyczna dla każdego elementu zbioru, względem której jest dokonywane sortowanie). Oznacza to, że dla każdych dwóch elementów R {\displaystyle R} i S {\displaystyle S} o tym samym kluczu, jeśli R {\displaystyle R} wystąpiło przed S {\displaystyle S} to po sortowaniu stabilnym R {\displaystyle R} nadal będzie przed S ; {\displaystyle S;}

Kiedy elementy o tym samym kluczu są nierozróżnialne, stabilność nie jest istotna.

Przykład: (para liczb całkowitych sortowana względem pierwszej wartości)

(4, 1) (3, 7) (3, 1) (5, 6)

W tym przypadku są możliwe dwa różne wyniki sortowania:

(3, 7) (3, 1) (4, 1) (5, 6) – kolejność zachowana
(3, 1) (3, 7) (4, 1) (5, 6) – kolejność zmieniona
  • Stabilne algorytmy sortowania gwarantują, że kolejność zostanie zachowana.
  • Niestabilne algorytmy sortowania mogą zmienić kolejność.

Algorytmy sortujące dzielimy na proste („naiwne”) i zaawansowane („logarytmiczne”). Powstanie lepszych niż proste algorytmów sortowania spowodowane było konsekwencjami poniższego faktu:

W losowym rozmieszczeniu n {\displaystyle n} elementów a [ 0 ] , a [ 1 ] , , a [ n 1 ] {\displaystyle a[0],a[1],\dots ,a[n-1]} każdy element jest przesunięty względem swojej pozycji w posortowanym ciągu a [ 0 ] , a [ 1 ] , , a [ n 1 ] {\displaystyle a'[0],a'[1],\dots ,a'[n-1]} średnio o n 3 {\displaystyle {\frac {n}{3}}} pozycji.

Jeżeli algorytm sortowania zamienia tylko elementy sąsiadujące ze sobą, musi dokonać średnio n 3 {\displaystyle {\frac {n}{3}}} zamian dla każdego z n {\displaystyle n} elementów. A więc średnia liczba porównań wynosi n n 3 = n 2 3 = O ( n 2 ) . {\displaystyle n\cdot {\frac {n}{3}}={\frac {n^{2}}{3}}=O(n^{2}).} Jedynym sposobem zmniejszenia asymptotycznej złożoności algorytmów sortujących jest wprowadzenie możliwości zamieniania elementów nie sąsiadujących ze sobą.

Przykładowe algorytmy sortowania

W podanej złożoności n {\displaystyle n} oznacza liczbę elementów do posortowania, k {\displaystyle k} liczbę różnych elementów.

Stabilne

Elementy o równej wartości będą występowały, po posortowaniu, w takiej samej kolejności jaką miały w zbiorze nieposortowanym.

  • sortowanie bąbelkowe (ang. bubblesort) – O ( n 2 ) {\displaystyle O(n^{2})}
  • sortowanie przez wstawianie (ang. insertion sort) – O ( n 2 ) {\displaystyle O(n^{2})}
  • sortowanie przez scalanie (ang. merge sort) – O ( n log n ) , {\displaystyle O(n\log n),} wymaga O ( n ) {\displaystyle O(n)} dodatkowej pamięci
  • sortowanie przez zliczanie (ang. counting sort lub count sort) – O ( n + k ) , {\displaystyle O(n+k),} wymaga O ( n + k ) {\displaystyle O(n+k)} dodatkowej pamięci
  • sortowanie kubełkowe (ang. bucket sort) – O ( n 2 ) , {\displaystyle O(n^{2}),} wymaga O ( k ) {\displaystyle O(k)} dodatkowej pamięci
  • sortowanie pozycyjne (ang. radix sort) – O ( d ( n + k ) ) , {\displaystyle O(d(n+k)),} gdzie k {\displaystyle k} to wielkość domeny cyfr, a d {\displaystyle d} szerokość kluczy w cyfrach. Wymaga O ( n + k ) {\displaystyle O(n+k)} dodatkowej pamięci
  • sortowanie biblioteczne (ang. library sort) – O ( n log n ) , {\displaystyle O(n\log n),} pesymistyczny O ( n 2 ) . {\displaystyle O(n^{2}).}

Niestabilne

  • sortowanie przez wybieranie (ang. selection sort) O ( n 2 ) {\displaystyle O(n^{2})} – może być stabilne po odpowiednich zmianach
  • sortowanie Shella – (ang. shellsort) złożoność nieznana;
  • sortowanie grzebieniowe – (ang. combsort) optymistyczny O ( n log n ) , {\displaystyle O(n\log n),} pesymistyczny O ( n 2 ) ; {\displaystyle O(n^{2});}
  • sortowanie szybkie – (ang. quicksort) O ( n log n ) , {\displaystyle O(n\log n),} pesymistyczny O ( n 2 ) ; {\displaystyle O(n^{2});}
  • sortowanie introspektywne – (ang. introspective sort lub introsort) O ( n log n ) ; {\displaystyle O(n\log n);}
  • sortowanie przez kopcowanie – (ang. heapsort) O ( n log n ) . {\displaystyle O(n\log n).}

Problemy

  • wyszukiwanie elementu o największej wartości funkcji porządkującej
  • wyszukiwanie n {\displaystyle n} -tego elementu.

Zobacz też

Przypisy

Bibliografia

  • Thomas H. Cormen, Charles E. Leiserson, Ronald L. Rivest, Clifford Stein: Wprowadzenie do algorytmów. WNT, 2007.

Linki zewnętrzne

  • Wizualizacja wielu algorytmów sortowania. (ang.).
  • Mergesort Java, Python, Ruby, Perl, C, PHP (ang.).. talkera.org.cp-in-1.webhostbox.net. [zarchiwizowane z tego adresu (2014-06-08)].
Encyklopedia internetowa (combinatorial algorithm):
  • SNL: sorteringsalgoritme