Matemática Computacional 03 – Crivo de Eratóstenes e o Menor Fator Primo

Escrito por Leonardo Paes e Lúcio Figueiredo

Na matemática computacional há diversas maneiras de checar se um número é primo ou não, com diferentes algoritmos que possuem seus pontos fortes e fracos. Na aula de hoje, aprenderemos um algoritmo chamado de Crivo de Eratóstenes. Como o próprio nome sugere, seu criador foi Eratóstenes (a.C. 285-194 a.C.), um matemático grego.

Motivação Inicial

Imagine que precisamos resolver o seguinte problema: dado um número inteiro $$N$$, indique quantos números primos existem no intervalo $$[1, N]$$ (intervalo de $$1$$ a $$N$$, inclusive). Para resolver este problema, podemos utilizar um algoritmo bastante simples: para cada número $$v$$ no intervalo $$[1, N]$$, realizamos um teste de primalidade em $$v$$ – se o teste indicar que $$v$$ é primo, a resposta do problema aumenta em 1; senão, continua a mesma. Se utilizarmos o teste de primalidade apresentando na Aula 2, obtemos uma solução com complexidade $$O(N \sqrt{n})$$, já que iteramos por $$N$$ números e realizamos um teste de primalidade em $$O(\sqrt{n})$$ em cada um.

Perceba, porém, que para valores de $$N$$ maiores ou iguais a $$10^8$$, o algoritmo acima é muito ineficiente, necessitando de pelo menos $$10^{12}$$ operações! Felizmente, uma solução mais eficiente existe: o Crivo de Eratóstenes, que será apresentado a seguir.

Crivo de Eratóstenes

O algoritmo em si é bem simples:

Escreva todos os números de $$2$$ até $$N$$. Inicialmente, nós não vamos considerá-los nem primos nem compostos (números que possuem mais que 2 divisores distintos).
Pegue o primeiro número que ainda não foi marcado como composto e diga que ele é primo.
A partir desse número primo, percorra todos os seus múltiplos até $$N$$ e marque-os como compostos. Eles necessariamente são compostos pois possuem como divisores, pelo menos, o número $$1$$, o primo atual e eles mesmos.
Volte para o passo 2 até que todos os números sejam marcados como primos ou compostos.

A ideia por trás do algoritmo é a seguinte: Um número $$X$$ só é primo se nenhum outro primo no intervalo $$[1; X-1]$$ divide $$X$$. Como estamos iterando pelos números primos da esquerda para a direita, estamos marcando como compostos todos os números que são seus múltiplos. Então, se chegarmos em um número que não foi dito como composto $$\implies$$ ele é primo!

Visualização do algoritmo

Gif utilizado de: Wikipedia.

Código do algoritmo

Complexidade do Crivo de Eratóstenes

Você deve ter percebido que até agora não foi dito nada sobre a complexidade do algoritmo do Crivo. Nesta aula, provaremos que a sua complexidade é $$O(N \log_{} N)$$.

Para simplificar os cálculos, vamos assumir que $$N$$ é uma potência de $$2$$, ou seja $$N = 2^k$$, $$k \in \mathbb{Z}$$. Seja $$f(N)$$ a complexidade do algoritmo. Note que $$f(N)$$ é igual ao somatório, para cada primo $$p \leq N$$, do número de múltiplos de $$p$$ menores ou iguais a $$N$$; em outras palavras, $$f(n)$$ é igual ao somatório de $$\lfloor \frac{N}{p} \rfloor$$ para todo número primo $$p \leq N$$. Portanto, perceba que se em nosso algoritmo, ao invés de iterarmos por todos os múltiplos dos números primos, iterássemos pelos múltiplos de todos os números menores ou iguais a $$N$$, a complexidade resultante do algoritmo seria maior ou igual à do Crivo – ou seja, maior ou igual a $$f(N)$$. Logo, temos que,

$$\lfloor \frac{N}{1} \rfloor + \lfloor \frac{N}{2} \rfloor + \lfloor \frac{N}{3} \rfloor + … + \lfloor \frac{N}{N} \rfloor \geq f(N)$$.

Vamos agora supor que a quantidade de operações é ainda maior (ou seja, utilizar um limite superior ainda mais “frouxo” para $$f(N)$$). Ao invés de somarmos $$\lfloor \frac{N}{i} \rfloor $$ para cada $$i \leq N$$, vamos somar $$\frac{N}{2^{\lfloor{log_{2} \ i} \rfloor}} $$. Desse modo, o número total de operações (que continua maior que $$f(N)$$) é:

$$\frac{N}{2^{\lfloor{log_{2} \ 1} \rfloor}} + \frac{N}{2^{\lfloor{log_{2} \ 3} \rfloor}} + … + \frac{N}{2^{\lfloor{log_{2} \ N} \rfloor}} \geq f(N)$$

Agora, note que $$\lfloor log_{2} \ 2^k \rfloor = \lfloor log_{2} \ (2^k + 1) \rfloor = \lfloor \log_{2} (2^k + 2) \rfloor \ … \ = \lfloor log_{2} \ (2^k + (2^k – 1)) \rfloor$$, já que estamos calculando a parte inteira de cada logaritmo. Utilizando este fato, podemos concluir que a expressão acima é equivalente a

$$\underbrace{\frac{N}{2^{\lfloor{log_{} \ 2^0} \rfloor}}}_{2^0 \text{ vezes}} + \underbrace{\frac{N}{2^{\lfloor{log_{} \ 2^1} \rfloor}} + \frac{N}{2^{\lfloor{log_{} \ 2^1} \rfloor}}}_{2^1 \text{ vezes}} + \ … \ + \underbrace{\frac{N}{2^{\lfloor{log_{} \ N} \rfloor}} + \frac{N}{2^{\lfloor{log_{} \ N} \rfloor}} + \ … \ + \frac{N}{2^{\lfloor{log_{} \ N} \rfloor}}}_{2^{log_{} N} \text{ vezes}}$$

$$ = 2^0 \cdot \frac{N}{2^0} + 2^1 \cdot \frac{N}{2^1} + \ … \ + 2^{log_{} N} \cdot \frac{N}{2^{\log_{} N}} = \underbrace{N + N + \ … \ + N}_{\log_{} N \text{ vezes}} = N \cdot \log_{} N$$

Como vimos que $$f(N)$$ é menor ou igual à expressão calculada acima, obtemos que $$f(N) \leq N \log_{} N$$ $$\implies$$ complexidade do Crivo de Eratóstenes $$\in O(N \cdot \log_{} N)$$.

Obs.: Na demonstração acima assumimos que o valor $$N$$ era uma potência de $$2$$. Caso isto não fosse verdade, o resultado obtido seria bastante semelhante, com a diferença de que a expressão $$\frac{N}{2^{\lfloor{log_{2} \ 1} \rfloor}} + \frac{N}{2^{\lfloor{log_{2} \ 3} \rfloor}} + … + \frac{N}{2^{\lfloor{log_{2} \ N} \rfloor}}$$ seria igual a $$N \cdot \log_{} N + O(N)$$; ou seja, $$N \cdot \log_{} N$$ somado a um valor “de resto” menor ou igual a $$N$$. Portanto, a complexidade do algoritmo é a mesma em ambos os casos.

Apesar de termos provado que o Crivo possui complexidade $$O(N \log N)$$, é possível provar que o algoritmo é ainda mais eficiente, possuindo complexidade $$O(N \log_{} \log_{} N)$$. Como a demonstração deste fato requer conhecimentos de cálculo integral, não a mencionamos nesta aula; porém, caso queira conferi-la, leia este artigo (em inglês).

O Menor Fator Primo (SPF)

Uma das aplicações do Crivo de Eratóstenes é o cálculo do Menor Fator Primo de um inteiro, ou SPF (do inglês Shortest Prime Factor). Alguns exemplos de SPF:

$$SPF(10) = 2$$, já que $$10 = 2 \cdot 5$$.
$$SPF(39) = 3$$, já que $$39 = 3 \cdot 13$$.
$$SPF(5797) = 11$$, já que $$5797 = 11 \cdot 17 \cdot 31$$.

Para calcular o SPF de todos os números no intervalo $$[1, N]$$, basta fazer uma única modificação ao Crivo de Eratóstenes. Inicialmente, vamos declarar o vetor $$SPF[]$$, que indica o menor fator primo de um número, e vamos inicializá-lo com o valor $$0$$. Após isso, vamos executar o Crivo. Se no passo atual do algoritmo o primeiro número não marcado é o primo $$p$$, vamos identificar se $$p$$ é ou não o menor fator primo de cada um de seus múltiplos, conferindo para cada múltiplo $$j$$ de $$p$$ se $$SPF[j]$$ é igual a $$0$$; se sim, $$j$$ não foi marcado, e portanto $$p$$ é seu menor fator primo; caso contrário, seu menor fator primo já foi encontrado em um passo anterior do algoritmo. O código abaixo implementa esta modificação do Crivo para encontrar SPFs:

Fatoração em $$O(\log_{} N)$$

Imagine que queremos fatorar um número inteiro $$N$$ em primos, ou seja, encontrar todos os seus divisores primos. Um algoritmo que resolve este problema é aquele que foi apresentado na aula anterior, com complexidade $$O(\sqrt{N})$$. Porém, utilizando o Menor Fator Primo calculado pelo Crivo de Eratóstenes, conseguimos realizar fatorações em $$O(\log_{} N)$$.

Inicialmente, perceba que um número inteiro $$N$$ possui, no máximo, $$\log_{2} N$$ fatores primos, já que o menor número primo é $$2$$ e o maior expoente $$x$$ tal que $$2^x \leq N$$ é $$\log_{2} N$$. Utilizando o SPF, podemos iterar por todos os primos na fatoração de $$N$$ em ordem, da seguinte forma:

Inicialmente, a lista de fatores primos de $$N$$ está vazia;
Se $$N$$ for maior que $$1$$, insira $$SPF(N)$$ na lista de fatores primos; senão, termine o algoritmo;
Repita o passo anterior fazendo $$N := \frac{N}{SPF(N)}.$$

Ou seja, primeiro inserimos $$SPF(N)$$ na lista, depois $$SPF(\frac{N}{SPF(N)})$$, e assim por diante, enquanto o número resultante for maior ou igual a $$1$$. Desta forma, conseguimos iterar por todos os fatores primos de $$N$$ em ordem. Como $$N$$ possui no máximo $$\log_{} N$$ fatores primos, a complexidade deste algoritmo de fatoração é $$O(\log_{} N)$$. O código abaixo implementa a fatoração de $$N$$ utilizando este método: