Informática - Ideia 01

Escrito por Lúcio Cardoso:

A técnica de compressão de coordenadas consiste, essencialmente, em mapear valores grandes dados em um problema para valores menores, a fim de reduzir gastos de memória e tempo. Vamos ilustrar a ideia com os seguintes exemplos:

Exemplo 1

Dado um vetor $$V$$ de $$N$$ números inteiros, calcule a quantidade de inversões em $$V$$, isto é, a quantidade de pares $$(i, j)$$ tais que $$i < j$$ e $$V[i] > V[j]$$.

Restrições: $$N \leq 10^5$$ e $$1 \leq V[i] \leq 10^9, \forall i \leq N$$.

Solução: Perceba que a quantidade total de inversões em $$V$$ é o mesmo que o somatório, para cada índice $$i$$, da quantidade de inversões que $$i$$ participa, ou seja, a quantidade de índices $$j$$ tais que $$i < j$$ e $$V[i] > V[j]$$. Para calcular isso, usaremos a estrutura de dados BIT (ou Binary Indexed Tree) da seguinte maneira: Criamos uma BIT onde cada um de seus índices guardará a quantidade de números em $$V$$ com valor igual a tal índice. De início, deixamos a BIT vazia e iteramos por cada posição $$i$$ do vetor, começando de $$N$$ e indo até 1. Assim, para descobrir de quantas inversões $$i$$ participa, basta calcular a soma dos valores desde o índice 1 ao $$V[i]-1$$ na BIT (o total de números menores que $$V[i]$$ até o momento). Depois, acrescentamos 1 ao índice $$V[i]$$ da estrutura, realizando o mesmo procedimento nos índices seguintes. Como a BIT realiza as duas operações de soma e atualização em $$O(\log{}n)$$, a complexidade final será $$O(n\log{}n)$$. Porém, a BIT precisa de uma posição reservada para cada um dos valores em $$V$$, que podem ser muito grandes (até $$10^9$$), e já que criar uma BIT com $$10^9$$ elementos é muito custoso, precisamos de outra solução.

Observe que como a quantidade de números distintos em $$V$$ é no máximo $$N$$, o vetor da BIT possui muitos “espaços vazios”. Além disso, o valor de cada elemento em $$V$$ é irrelevante; o que nos interessa ao calcular as inversões são apenas as relações ($$>$$ ou $$<$$) entre tais valores. Queremos então reduzir (comprimir) os números no vetor sem modificar as relações entre eles.

Para isso, vamos inserir cada valor de $$V$$ em um vetor auxiliar e então ordená-lo. Depois, mapeamos cada número neste vetor para um número menor de acordo com a ordem presente (ou seja, o menor número será mapeado para 1, o segundo menor para 2, etc.), comprimindo, assim, os valores de $$V$$. Podemos, assim, substituir cada um dos números no vetor original pelos seus respectivos valores mapeados, pois como o vetor auxiliar foi ordenado, as relações entre os números foram mantidas. Utilizando o próprio map do C++, é possível realizar a compressão desejada em $$O(N\log{}N)$$, e já que o maior valor comprimido de um número em $$V$$ será $$N$$, podemos usar a BIT seguindo o mesmo algoritmo descrito acima. A complexidade final será $$O(N\log{}N)$$. Confira o código para melhor entendimento:

	// NOIC – Ideia 1
	// Exemplo 1
	// Complexidade: O(N log N)

	#include <bits/stdc++.h>

	using namespace std;

	const int maxn = 1e5+10;

	int n, V[maxn], bit[maxn];

	// somar v na posição x
	void upd(int x, int v)
	{
	for (; x <= n; x += (x&-x))
	bit[x] += v;
	}

	// soma de 1 até x
	int soma(int x)
	{
	int ans = 0;
	for (; x > 0; x -= (x&-x))
	ans += bit[x];
	return ans;
	}

	int main(void)
	{
	cin >> n;

	vector<int> C; // vetor auxiliar

	for (int i = 1; i <= n; i++)
	{
	cin >> V[i];

	C.push_back(V[i]);
	}

	sort(C.begin(), C.end()); // ordenamos C

	int ind = 0;
	map<int, int> Mp;

	for (int i = 0; i < C.size(); i++)
	if (Mp.find(C[i]) == Mp.end()) // se C[i] não foi mapeado ainda
	Mp[C[i]] = ++ind; // valor mapeado de C[i]

	long long ans = 0; // resposta (que pode chegar a long long)
	for (int i = n; i >= 1; i–)
	{
	// a partir de agora trocamos os V[i]s pelos seus valores mapeados

	ans += soma(Mp[V[i]]-1); // inversões que i participa

	upd(Mp[V[i]], 1);
	}

	cout << ans << "\n";
	}

view raw

noic-ideia01-ex01.cpp

hosted with ❤ by GitHub

Exemplo 2

Temos um vetor $$V$$ de $$N$$ inteiros com seus valores inicialmente iguais a 0. São dados $$M$$ pares $$(i, x)$$ $$(x \in \mathbb{Z}_+^*)$$ indicando que o valor de $$V[i]$$ foi atualizado para $$x$$. Os pares são dados em ordem estritamente crescente de $$i$$. Após isso, $$K$$ perguntas serão feitas, sendo representandas por um par $$(l, r)$$. Para cada pergunta, calcule a soma dos valores em $$V$$ com índices entre (e incluindo) $$l$$ e $$r$$.

Restrições: $$N \leq 10^9, M \leq 10^5, K \leq 10^5$$.

Solução: Novamente, não é eficiente guardar o vetor $$V$$, já que o valor de $$N$$ pode ser muito grande. No entanto, há muitos números iguais a 0 no vetor, e como nenhum deles irá contribuir para a resposta das perguntas, podemos enxergá-los como “gaps”. Vamos então fazer uma compressão apenas com as posições dadas nos $$M$$ pares, inserindo cada um deles em um vetor $$C$$ na ordem em que são dados. Note, assim, que $$C$$ já estará ordenado pelo valor $$i$$ (o primeiro elemento) de cada par. Feito isso, comprimimos as $$M$$ posições dadas, já que pela descrição do problema, são todas distintas (considere que o valor mapeado do índice $$i$$ num par em $$C$$ é a própria posição do par neste vetor).

Porém, os números nos índices $$l$$ e $$r$$ dados nas perguntas podem ser 0, e, consequentemente, não serão considerados na compressão; logo, a ordem relativa de tais índices com aqueles em $$C$$ será perdida. Apesar disso, note que se o valor no índice $$l$$ de uma pergunta, de fato, for 0, a soma no intervalo $$[l…r]$$ será a mesma que no intervalo $$[a…r]$$, onde $$a$$ é o primeiro índice em $$V$$ — maior ou igual a $$l$$ —, cujo valor no vetor é positivo. Isso vale porque todos os números entre $$a$$ e $$l$$ são 0. De maneira similar para $$r$$, se o valor em $$r$$ é 0, a soma em $$[l…r]$$ será a mesma que em $$[l…b]$$, onde $$b$$ é último índice em $$V$$ — menor ou igual a $$r$$ —, cujo valor no vetor é positivo. É possível encontrar os valores mapeados de $$a$$ e $$b$$ em $$O(\log{}M)$$ fazendo-se uma busca binária no vetor $$C$$, para cada uma das perguntas (mais detalhes no código abaixo). De tal forma, conseguimos respondê-las trabalhando apenas com índices do vetor $$C$$.

A fim de finalizar o problema, precisamos calcular a soma dos valores entre dois índices $$l$$ e $$r$$ quaisquer em $$C$$. Se $$x_i$$ for o valor $$x$$ do $$i$$-ésimo par em $$C$$, então observe que

\[\sum_{i=l}^r x_i = \sum_{i=1}^r x_i – \sum_{i=1}^{l-1} x_i\]

Portanto, se $$soma[i]$$ é igual à soma dos valores $$x$$ desde a posição 1 até $$i$$,

\[\sum_{i=l}^r x_i = soma[r] – soma[l-1]\]

Logo, é possível calcular a soma referida acima em $$O(1)$$, precalculando o vetor $$soma$$ para cada posição no vetor com complexidade $$O(M)$$ (basta ver que $$soma[i] = soma[i-1] + x_i)$$. Esta técnica é bastante útil e é conhecida como soma de prefixos. A complexidade final do problema será $$O(K\log{}M)$$, devido à busca binária realizada em cada uma das $$K$$ perguntas. Confira o código abaixo para melhor entendimento:

	// NOIC – Ideia 1
	// Exemplo 2
	// Complexidade: O(K log M)

	#include <bits/stdc++.h>

	using namespace std;

	const int maxn = 1e5+10;

	typedef pair<int, int> pii;

	int soma[maxn];

	int main(void)
	{
	int n, m, k;
	cin >> n >> m >> k;

	vector<pii> C;

	for (int j = 1; j <= m; j++)
	{
	int i, x;
	cin >> i >> x;

	C.push_back({i, x}); // inserimos cada par em C
	}

	soma[0] = 0; // caso base
	for (int i = 1; i <= m; i++)
	soma[i] = soma[i-1] + C[i-1].second; // calculamos a soma de prefixos

	for (int i = 1; i <= k; i++)
	{
	int l, r;
	cin >> l >> r;

	// a função lower bound do C++ realiza uma busca binária
	// ela retorna a primeira posição em um vetor ordenado que tem valor maior ou igual a um certo parâmetro dado
	// no caso, queremos a primeira posição em C cujo índice no par é maior ou igual a l
	// por isso usamos o par {l, 0}
	int a = (int)(lower_bound(C.begin(), C.end(), make_pair(l, 0))-C.begin());

	// fazemos o mesmo pra posição b, nesse caso para achar a última posição menor
	// ou igual a r encontramos a primeira maior ou igual a r+1 e subtraímos 1 dela
	int b = (int)(lower_bound(C.begin(), C.end(), make_pair(r+1, 0))-C.begin()-1);

	a++, b++; // como C é 0-indexado, aumentamos 1 em a e b

	if (a > b) cout << "0\n"; // se a >= b, todos os números em [l…r] são iguais a 0
	else cout << soma[b]-soma[a-1] << "\n"; // soma em [a…b]
	}
	}

view raw

noic-ideia01-ex02.cpp

hosted with ❤ by GitHub

&nbsp

Problemas para praticar

Arco e Flecha (OBI 2016 – P1 – F2)
BGSHOOT
Wowow (Olimpíada Canadense de Computação (CCO) 2010)
Enemy is weak

Obs.: Os problemas acima utilizam compressão de coordenadas de alguma maneira, porém podem precisar de alguma estrutura de dados (como BIT ou Segment Tree) ou outra técnica.

Informática – Ideia 01

Exemplo 1

Exemplo 2

Problemas para praticar