Pessoal, hoje vamos continuar nossas anotações de Ciências da Computação com um assunto que vai aparecer em entrevistas técnicas, provas e no dia a dia de qualquer dev: algoritmos de ordenação. A ordenação de dados é uma operação fundamental, e dominar os principais algoritmos nos ensina muito sobre análise de complexidade, recursão e como escolher a ferramenta certa para cada problema.
Vamos revisar os algoritmos clássicos, implementar cada um em Python e analisar seus pontos fortes e fracos.
Bubble Sort
O Bubble Sort é geralmente o primeiro algoritmo de ordenação que aprendemos. A ideia é simples: percorremos a lista repetidamente, comparando elementos adjacentes e trocando-os se estiverem na ordem errada. A cada passada, o maior elemento "flutua" para o final da lista, como uma bolha.
def bubble_sort(arr):
n = len(arr)
for i in range(n):
swapped = False
for j in range(0, n - i - 1):
if arr[j] > arr[j + 1]:
arr[j], arr[j + 1] = arr[j + 1], arr[j]
swapped = True
if not swapped:
break
return arr
A complexidade do Bubble Sort é O(n²) no pior caso e O(n) no melhor caso (com a otimização da flag swapped). É um algoritmo estável e in-place, mas raramente usado na prática para listas grandes por ser muito lento.
Selection Sort
O Selection Sort divide a lista em uma parte ordenada (à esquerda) e uma parte não ordenada (à direita). A cada iteração, ele seleciona o menor elemento da parte não ordenada e o troca com o primeiro elemento dessa parte, movendo a fronteira da parte ordenada uma posição para a direita.
def selection_sort(arr):
n = len(arr)
for i in range(n):
min_idx = i
for j in range(i + 1, n):
if arr[j] < arr[min_idx]:
min_idx = j
arr[i], arr[min_idx] = arr[min_idx], arr[i]
return arr>
Sua complexidade é O(n²) em todos os casos (melhor, pior e médio), o que o torna ainda pior que o Bubble Sort para listas parcialmente ordenadas. É in-place, mas não é estável. Seu principal uso é quando o custo de escrever na memória é muito alto, pois ele faz no máximo O(n) trocas.
Insertion Sort
O Insertion Sort é o algoritmo que muitas pessoas usam instintivamente para ordenar cartas de baralho. Ele constrói a lista ordenada um elemento por vez, inserindo cada novo elemento na posição correta em relação aos que já foram ordenados.
def insertion_sort(arr):
for i in range(1, len(arr)):
key = arr[i]
j = i - 1
while j >= 0 and key < arr[j]:
arr[j + 1] = arr[j]
j -= 1
arr[j + 1] = key
return arr>
A complexidade é O(n²) no pior caso, mas O(n) no melhor caso (quando a lista já está ordenada). É um algoritmo estável e in-place. Na prática, é muito eficiente para listas pequenas (menos de ~50 elementos) ou que já estão quase ordenadas. Por isso, muitos algoritmos avançados (como o Timsort do Python) utilizam Insertion Sort como caso base para sublistas pequenas.
Merge Sort
O Merge Sort é um algoritmo baseado no paradigma "Dividir para Conquistar" (Divide and Conquer). Ele divide recursivamente a lista ao meio até que reste apenas um elemento (uma lista de um elemento já está ordenada). Depois, ele mescla (merge) as sublistas ordenadas, comparando os primeiros elementos e construindo a lista final de forma ordenada.
def merge_sort(arr):
if len(arr) <= 1:
return arr
mid = len(arr) // 2
left = merge_sort(arr[:mid])
right = merge_sort(arr[mid:])
return merge(left, right)
def merge(left, right):
result = []
i = j = 0
while i >< len(left) and j >< len(right):
if left[i] ><= right[j]:
result.append(left[i])
i += 1
else:
result.append(right[j])
j += 1
result.extend(left[i:])
result.extend(right[j:])
return result>
A grande vantagem do Merge Sort é sua complexidade O(n log n) no pior caso. É um algoritmo estável, mas não é in-place (requer O(n) de espaço auxiliar). É a escolha ideal quando a previsibilidade da performance é mais importante que o uso de memória.
Quick Sort
O Quick Sort também usa "Dividir para Conquistar". Ele escolhe um elemento como pivô e particiona a lista em três partes: elementos menores que o pivô, iguais ao pivô e maiores que o pivô. Em seguida, ordena recursivamente as sublistas de elementos menores e maiores.
def quick_sort(arr):
if len(arr) <= 1:
return arr
pivot = arr[len(arr) // 2]
left = [x for x in arr if x >< pivot]
middle = [x for x in arr if x == pivot]
right = [x for x in arr if x > pivot]
return quick_sort(left) + middle + quick_sort(right)
O Quick Sort tem complexidade O(n log n) no caso médio e melhor caso, mas O(n²) no pior caso (que pode ser evitado com boas escolhas de pivô, como a mediana de três). Na prática, ele é geralmente o mais rápido para arrays grandes em memória, porém não é estável (na versão clássica in-place). A versão acima não é in-place, mas existem implementações que são.
Tabela Comparativa
| Algoritmo | Melhor Caso | Caso Médio | Pior Caso | Espaço | Estável | In-Place |
|---|---|---|---|---|---|---|
| Bubble Sort | O(n) | O(n²) | O(n²) | O(1) | Sim | Sim |
| Selection Sort | O(n²) | O(n²) | O(n²) | O(1) | Não | Sim |
| Insertion Sort | O(n) | O(n²) | O(n²) | O(1) | Sim | Sim |
| Merge Sort | O(n log n) | O(n log n) | O(n log n) | O(n) | Sim | Não |
| Quick Sort | O(n log n) | O(n log n) | O(n²) | O(log n) | Não | Sim* |
Perguntas Frequentes (FAQ)
Qual algoritmo de ordenação é o mais rápido na prática?
Para arrays grandes e aleatórios, o Quick Sort geralmente é o mais rápido devido à boa localidade de referência e ao baixo overhead. Porém, o Merge Sort tem performance O(n log n) garantida e é estável, sendo a escolha ideal quando esses requisitos são críticos. O Python usa o Timsort, um híbrido de Merge Sort e Insertion Sort, que é extremamente eficiente para dados do mundo real.
Quando devo usar Insertion Sort?
O Insertion Sort é a melhor escolha para listas muito pequenas (menos de ~50 elementos) ou para listas que já estão quase ordenadas. É por isso que ele é frequentemente usado como a base da recursão em algoritmos avançados como o Quick Sort e o Merge Sort.
O que significa um algoritmo ser "estável"?
Um algoritmo de ordenação é dito estável quando ele preserva a ordem relativa de elementos que são considerados iguais pela chave de ordenação. Isso é importante quando você ordena uma lista múltiplas vezes (ex: ordenar por nome e depois por data). Se o algoritmo não for estável, a ordenação anterior pode ser desfeita para elementos iguais na segunda ordenação.
Qual a diferença entre In-Place e Não In-Place?
Um algoritmo in-place ordena os dados diretamente na estrutura original, usando apenas uma quantidade constante de memória extra (como o Bubble Sort). Um algoritmo não in-place (como o Merge Sort) cria novas estruturas de dados (cópias das sublistas) durante o processo, consumindo mais memória, mas podendo oferecer outras vantagens como estabilidade e performance previsível.
Conclusão
Dominar os algoritmos de ordenação é essencial para qualquer cientista da computação. Eles nos ensinam conceitos fundamentais como análise de complexidade, recursão e a importância de escolher a ferramenta certa para o problema certo. A prática de implementar cada um deles do zero solidifica o entendimento e prepara para problemas mais complexos.
No próximo encontro, vamos explorar algoritmos de busca e como eles se relacionam com a ordenação. Bons estudos!