Ciências da computação dia 237

Algoritmos de Ordenação: Bubble Sort, Merge Sort e Quick Sort

18 de novembro de 2024

Pessoal, hoje vamos continuar nossas anotações de Ciências da Computação com um assunto que vai aparecer em entrevistas técnicas, provas e no dia a dia de qualquer dev: algoritmos de ordenação. A ordenação de dados é uma operação fundamental, e dominar os principais algoritmos nos ensina muito sobre análise de complexidade, recursão e como escolher a ferramenta certa para cada problema.

Vamos revisar os algoritmos clássicos, implementar cada um em Python e analisar seus pontos fortes e fracos.

Bubble Sort

O Bubble Sort é geralmente o primeiro algoritmo de ordenação que aprendemos. A ideia é simples: percorremos a lista repetidamente, comparando elementos adjacentes e trocando-os se estiverem na ordem errada. A cada passada, o maior elemento "flutua" para o final da lista, como uma bolha.

def bubble_sort(arr):
    n = len(arr)
    for i in range(n):
        swapped = False
        for j in range(0, n - i - 1):
            if arr[j] > arr[j + 1]:
                arr[j], arr[j + 1] = arr[j + 1], arr[j]
                swapped = True
        if not swapped:
            break
    return arr

A complexidade do Bubble Sort é O(n²) no pior caso e O(n) no melhor caso (com a otimização da flag swapped). É um algoritmo estável e in-place, mas raramente usado na prática para listas grandes por ser muito lento.

Selection Sort

O Selection Sort divide a lista em uma parte ordenada (à esquerda) e uma parte não ordenada (à direita). A cada iteração, ele seleciona o menor elemento da parte não ordenada e o troca com o primeiro elemento dessa parte, movendo a fronteira da parte ordenada uma posição para a direita.

def selection_sort(arr):
    n = len(arr)
    for i in range(n):
        min_idx = i
        for j in range(i + 1, n):
            if arr[j] < arr[min_idx]:
                min_idx = j
        arr[i], arr[min_idx] = arr[min_idx], arr[i]
    return arr>

Sua complexidade é O(n²) em todos os casos (melhor, pior e médio), o que o torna ainda pior que o Bubble Sort para listas parcialmente ordenadas. É in-place, mas não é estável. Seu principal uso é quando o custo de escrever na memória é muito alto, pois ele faz no máximo O(n) trocas.

Insertion Sort

O Insertion Sort é o algoritmo que muitas pessoas usam instintivamente para ordenar cartas de baralho. Ele constrói a lista ordenada um elemento por vez, inserindo cada novo elemento na posição correta em relação aos que já foram ordenados.

def insertion_sort(arr):
    for i in range(1, len(arr)):
        key = arr[i]
        j = i - 1
        while j >= 0 and key < arr[j]:
            arr[j + 1] = arr[j]
            j -= 1
        arr[j + 1] = key
    return arr>

A complexidade é O(n²) no pior caso, mas O(n) no melhor caso (quando a lista já está ordenada). É um algoritmo estável e in-place. Na prática, é muito eficiente para listas pequenas (menos de ~50 elementos) ou que já estão quase ordenadas. Por isso, muitos algoritmos avançados (como o Timsort do Python) utilizam Insertion Sort como caso base para sublistas pequenas.

Merge Sort

O Merge Sort é um algoritmo baseado no paradigma "Dividir para Conquistar" (Divide and Conquer). Ele divide recursivamente a lista ao meio até que reste apenas um elemento (uma lista de um elemento já está ordenada). Depois, ele mescla (merge) as sublistas ordenadas, comparando os primeiros elementos e construindo a lista final de forma ordenada.

def merge_sort(arr):
    if len(arr) <= 1:
        return arr
    mid = len(arr) // 2
    left = merge_sort(arr[:mid])
    right = merge_sort(arr[mid:])
    return merge(left, right)

def merge(left, right):
    result = []
    i = j = 0
    while i >< len(left) and j >< len(right):
        if left[i] ><= right[j]:
            result.append(left[i])
            i += 1
        else:
            result.append(right[j])
            j += 1
    result.extend(left[i:])
    result.extend(right[j:])
    return result>

A grande vantagem do Merge Sort é sua complexidade O(n log n) no pior caso. É um algoritmo estável, mas não é in-place (requer O(n) de espaço auxiliar). É a escolha ideal quando a previsibilidade da performance é mais importante que o uso de memória.

Quick Sort

O Quick Sort também usa "Dividir para Conquistar". Ele escolhe um elemento como pivô e particiona a lista em três partes: elementos menores que o pivô, iguais ao pivô e maiores que o pivô. Em seguida, ordena recursivamente as sublistas de elementos menores e maiores.

def quick_sort(arr):
    if len(arr) <= 1:
        return arr
    pivot = arr[len(arr) // 2]
    left = [x for x in arr if x >< pivot]
    middle = [x for x in arr if x == pivot]
    right = [x for x in arr if x > pivot]
    return quick_sort(left) + middle + quick_sort(right)

O Quick Sort tem complexidade O(n log n) no caso médio e melhor caso, mas O(n²) no pior caso (que pode ser evitado com boas escolhas de pivô, como a mediana de três). Na prática, ele é geralmente o mais rápido para arrays grandes em memória, porém não é estável (na versão clássica in-place). A versão acima não é in-place, mas existem implementações que são.

Tabela Comparativa

Algoritmo	Melhor Caso	Caso Médio	Pior Caso	Espaço	Estável	In-Place
Bubble Sort	O(n)	O(n²)	O(n²)	O(1)	Sim	Sim
Selection Sort	O(n²)	O(n²)	O(n²)	O(1)	Não	Sim
Insertion Sort	O(n)	O(n²)	O(n²)	O(1)	Sim	Sim
Merge Sort	O(n log n)	O(n log n)	O(n log n)	O(n)	Sim	Não
Quick Sort	O(n log n)	O(n log n)	O(n²)	O(log n)	Não	Sim*

Perguntas Frequentes (FAQ)

Qual algoritmo de ordenação é o mais rápido na prática?

Para arrays grandes e aleatórios, o Quick Sort geralmente é o mais rápido devido à boa localidade de referência e ao baixo overhead. Porém, o Merge Sort tem performance O(n log n) garantida e é estável, sendo a escolha ideal quando esses requisitos são críticos. O Python usa o Timsort, um híbrido de Merge Sort e Insertion Sort, que é extremamente eficiente para dados do mundo real.

Quando devo usar Insertion Sort?

O Insertion Sort é a melhor escolha para listas muito pequenas (menos de ~50 elementos) ou para listas que já estão quase ordenadas. É por isso que ele é frequentemente usado como a base da recursão em algoritmos avançados como o Quick Sort e o Merge Sort.

O que significa um algoritmo ser "estável"?

Um algoritmo de ordenação é dito estável quando ele preserva a ordem relativa de elementos que são considerados iguais pela chave de ordenação. Isso é importante quando você ordena uma lista múltiplas vezes (ex: ordenar por nome e depois por data). Se o algoritmo não for estável, a ordenação anterior pode ser desfeita para elementos iguais na segunda ordenação.

Qual a diferença entre In-Place e Não In-Place?

Um algoritmo in-place ordena os dados diretamente na estrutura original, usando apenas uma quantidade constante de memória extra (como o Bubble Sort). Um algoritmo não in-place (como o Merge Sort) cria novas estruturas de dados (cópias das sublistas) durante o processo, consumindo mais memória, mas podendo oferecer outras vantagens como estabilidade e performance previsível.

Conclusão

Dominar os algoritmos de ordenação é essencial para qualquer cientista da computação. Eles nos ensinam conceitos fundamentais como análise de complexidade, recursão e a importância de escolher a ferramenta certa para o problema certo. A prática de implementar cada um deles do zero solidifica o entendimento e prepara para problemas mais complexos.

No próximo encontro, vamos explorar algoritmos de busca e como eles se relacionam com a ordenação. Bons estudos!