Técnicas de Programação – Soma Máxima em Intervalo

Aula por Arthur Lobo

Nessa aula, vamos falar sobre técnicas usadas para encontrar a maior soma de um intervalo contínuo em um vetor e suas aplicações.

Motivação inicial

Vamos imaginar o seguinte problema: Dado um vetor inicial de tamanho $$N$$, $$A_1, A_2 … A_N$$, com números inteiros entre $$-100$$ e $$100$$, responda qual é a maior soma de um intervalo contínuo. Formalmente, diga qual o maior valor de $$A_i+A_{i+1}+…+A_j$$, com $$1 \le i \le j \le N$$.

Se quiser ler o enunciado inteiro e com mais detalhes, clique aqui.

Uma primeira ideia que podemos ter para resolver o problema é testar todos os intervalos $$(i,j)$$ (começando em $$i$$ e terminando em $$j$$) e ver qual deles tem a maior soma. Para isso podemos criar uma função $$soma(i,j)$$, que retorna a soma de $$i$$ até $$j$$ fazendo um $$for$$ no intervalo inteiro e somando os valores correspondentes Essa solução tem a complexidade $$O(N^3)$$, pois testamos $$O(N^2)$$ pares e a função $$soma(i,j)$$ funciona em $$O(N)$$.

Ainda podemos melhorar essa solução usando soma de prefixo: primeiro calculamos o vetor de somas de prefixo $$S$$, em que $$S_i$$ guardará a soma $$A_1+A_2+…+A_i$$, e então podemos fazer com que a função $$soma(i,j)$$ seja respondida em $$O(1)$$, já que podemos apenas retornar $$S_j – S_{i-1}$$. Dessa maneira, podemos fazer essa ideia rodar em $$O(N^2)$$, mas ainda podemos fazer melhor!

Algoritmo de Kadane

A ideia do algoritmo de Kadane é realizarmos uma solução gulosa. Vamos iterar do $$1$$ até o $$N$$, quando estivermos em $$i$$, sempre manteremos 2 valores: a resposta máxima até aqui e o valor do intervalo de soma máximo terminando em $$i$$, guardaremos eles em $$resp$$ e $$soma$$, respectivamente.

O algoritmo é o seguinte, digamos que acabamos de calcular a iteração de $$i-1$$, na iteração de $$i$$ vamos seguir os seguintes passos:

Primeiro, verificamos se $$soma$$ é menor que $$0$$, caso seja, fazemos com que ela retorne a ser $$0$$. A ideia é que sempre que o intervalo ficar negativo, vamos descartar ele inteiro.
Depois, adicionamos $$A_i$$ em $$soma$$, fazendo $$soma = soma + A_i$$. Nesse momento, é garantido que $$soma$$ guarda o valor do intervalo de soma máxima que termina em $$i$$ (vamos provar isso logo em seguida).
Por último, iremos atualizar $$resp$$ caso $$soma$$ seja maior que $$resp$$ fazendo $$resp = max(resp,soma)$$

A intuição por trás do algoritmo de Kadane é que sempre que a soma do intervalo fica menor que $$0$$, nós resetamos ela, fazendo com que volte a ser $$0$$. Isso faz com que, sempre que estamos em $$i$$, $$soma$$ guardá o valor do intervalo de soma máxima que termina em $$i$$, portanto, pegamos o intervalo de soma máxima do vetor inteiro. A prova do porque podemos resetar (fazer o início e o final do intervalo ser $$i$$) fica como um exercício para o leitor, mas a ideia é imaginar o que aconteceria se fosse melhor mudar o início do intervalo para uma posição diferente de $$i$$.

Soma de Prefixo

Além da solução com o algoritmo de Kadane, esse problema também pode ser resolvido utilizando somas de prefixo. Além de ser mais intuitiva, a solução com soma de prefixo pode ser usada em diversas variações do problema. Agora vamos olhar ela mais de perto:

No início da aula, falamos sobre fazer um vetor de somas de prefixos $$S$$, em que $$S_i$$ guarda $$A_1+A_2+…+A_i$$ (em particular, $$S_0 = 0$$), e usar isso para descobrir a soma entre quaisquer de $$i$$ até $$j$$ ($$i \le j$$) fazendo a conta $$S_j-S_{i-1}$$. Portanto, queremos encontrar o valor máximo de $$S_j-S_{i-1}$$.

Assim como no algoritmo de Kadane, nosso objetivo vai ser descobrir qual a maior soma de intervalo terminando em cada $$j$$. Para isso, vamos fixar o $$j$$ na nossa conta e olhar apenas para o $$i$$, Fazemos isso para todo $$j$$ de $$1$$ até $$N$$.

Queremos encontrar o maior valor de $$S_j-S_{i-1}$$, a partir do momento que fixamos um $$j$$, o valor do primeiro termo ($$S_j$$) é fixado também, então nosso objetivo virou apenas maximizar o segundo termo, ou seja, $$-S_{i-1}$$, e maximizar isso é o mesmo que minimizar $$S_{i-1}$$, já que está ele subtraindo. Como temos que $$1 \le i \le j \Rightarrow 0 \le i-1 \le j-1$$, então queremos que $$S_{i-1}$$ seja o menor valor entre $$S_0, S_1,…,S_{j-1}$$.

Para computarmos isso em cada $$j$$ de $$1$$ até $$N$$, podemos iterar nessa ordem, guardando sempre o valor do menor prefixo até $$j-1$$ na variável $$menor$$, ao mesmo tempo que vamos atualizando a resposta em cada iteração, guardando ela em $$resp$$:

Começamos com $$menor = 0$$ e $$resp = -infinito$$ (com infinito sendo um número muito grande), e para cada $$j$$ de $$1$$ até $$N$$ nosso algoritmo realizará os seguintes passos:

Primeiro, vemos se $$S_{j-1} < menor$$, e caso for, o atualizamos fazendo $$menor = min(menor,S_{j-1})$$.
Agora sabemos que o valor do intervalo de soma máxima que termina em $$j$$ é $$S_j-menor$$, então comparamos a resposta atual com essa possível resposta fazendo $$resp = max(resp,S_j-menor)$$.

A intuição por trás do algoritmo é que sempre queremos subtrair o menor valor possível de $$S_j$$, então a melhor opção é pegar o prefixo com a menor soma até $$j-1$$. Vale ressaltar que o problema inicial diz que temos que pegar pelo menos um valor do vetor, então se todos os elementos em $$A$$ fossem negativos, nossa resposta seria negativa. Mas caso um problema fale que podemos escolher não pegar nenhum valor do vetor, então caso todos os elementos em $$A$$ sejam negativos, a resposta será $$0$$.

Problemas para praticar

Agora é a sua vez! Tente fazer esses problemas que usam os algoritmos ensinados na aula de hoje ou ideias semelhantes: