Introdução ao Machine Learning

representações numéricas, modelos e a abstração da realidade

Escrito por Sophia Oliveira Alves

Ideia central: Uma máquina não começa entendendo casas, textos, imagens ou conceitos. Ela começa recebendo números. Por isso, antes de escolher um algoritmo, precisamos transformar a realidade em uma representação numérica que preserve as características importantes do problema. Ao explorarmos essa abstração criadora, descobriremos que a nossa própria percepção biológica da realidade opera exatamente sob o mesmo princípio.

Tópicos abordados

O que é Machine Learning?
A ilusão do contato direto: biologia vs. silício
Da realidade aos números: features
O isolamento entrópico: humanos e IAs como ilhas de ordem
Como um modelo aprende?
Aplicabilidade e Conclusão

1. O que é Machine Learning?

Machine Learning é uma área da Inteligência Artificial em que computadores aprendem padrões a partir de exemplos. Em vez de programarmos manualmente todas as regras de decisão, oferecemos dados e deixamos que um modelo ajuste seus parâmetros para melhorar suas previsões.

A diferença pode ser entendida assim: em um programa tradicional, escrevemos uma regra explícita, como “se acontecer A, faça B”. Em Machine Learning, mostramos exemplos de entrada e saída, e o modelo tenta encontrar uma relação matemática que explique esses exemplos. Depois, se o
aprendizado foi bom, ele consegue lidar também com casos novos, que não estavam exatamente no conjunto inicial.

Por isso, Machine Learning não é apenas “usar um algoritmo”. É construir uma ponte entre o mundo real e uma forma matemática de representá-lo. O modelo não aprende casas, textos ou imagens diretamente; ele aprende a partir da forma como essas coisas foram convertidas em dados.

Ponto-chave: A qualidade da representação influencia diretamente a qualidade do aprendizado. Um modelo bom pode falhar se receber dados ruins, incompletos ou pouco representativos.

1.1. A ilusão do contato direto: biologia vs. silício

Apesar de frequentemente acharmos que somos incomparáveis aos computadores — sob a crença arrogante de que eles processam matrizes frias de números enquanto nós possuímos um contato “real, autêntico e direto” com o mundo exterior —, essa percepção é, no mínimo, uma simplificação da forma como percebemos o mundo.

O ser humano não tem acesso tangível ou direto à realidade física. O que chamamos de “visão”, “audição” ou “tato” não é o mundo real adentrando nossa mente. Nós apenas recebemos representações do mundo externo através dos nossos sensores biológicos (a retina nos olhos, a cóclea nos ouvidos, os mecanorreceptores na pele).

A luz refletida por uma maçã não entra no seu cérebro; os fótons luminosos colidem com suas células fotorreceptoras, que atuam como maravilhosos transdutores, traduzindo esse estímulo físico puramente em intensidades de sinal elétrico (potenciais de ação). Esses sinais trafegam pela escuridão do seu nervo óptico e são, por fim, decodificados pelo seu cérebro — que também se encontra trancado no absoluto silêncio da caixa craniana —, traduzindo esses dados de entrada nas representações abstratas coloridas e sonoras que você chama intimamente de “realidade”.

Exatamente o mesmo ocorre nos computadores. Uma máquina utiliza sensores digitais (como câmeras) para transformar fótons em valores numéricos (matrizes de pixels RGB) que serão interpretados por seus algoritmos. Desta forma, não somos tão diferentes. Ambos os sistemas operam partindo de sinais elétricos ou numéricos indiretos e codificados para
construir uma simulação interna que dê sentido ao universo.

2. Da realidade aos números:
features

As informações usadas como entrada de um modelo são chamadas de features. Elas são características que descrevem um exemplo e podem ser organizadas numericamente.

Imagine o problema de estimar o desempenho de um estudante em uma prova. O estudante real não é apenas um número: ele tem rotina, dificuldades, concentração, sono, base teórica, prática de exercícios e muitas outras características. Para que um modelo consiga trabalhar com esse problema, precisamos selecionar algumas informações e criar uma representação
numérica:

Como o Modelo Pondera as Features

Altere os dados reais dos alunos abaixo. A IA tentará prever a nota aprendendo padrões matemáticos das variáveis de entrada.

Aluno	Estudo (h)	Questões	Sono (h)	Nota Anterior	Target (Previsão)
{{ aluno.id }}	{{ aluno.estudo }}	{{ aluno.questoes }}	{{ aluno.sono }}	{{ aluno.anterior }}	{{ calcularNota(aluno) }}/ 100

Cada linha é uma representação simplificada de um estudante. A situação real virou um conjunto de números. A partir disso, o modelo pode tentar aprender relações, por exemplo: mais prática tende a melhorar o desempenho; dormir pouco pode prejudicar a nota; uma nota anterior pode indicar parte da base que o aluno já possui.

De forma simplificada, poderíamos imaginar um modelo que prevê uma nota como:

nota prevista = a · horas de estudo + b · questões feitas + c · horas de sono + d · nota anterior + e

Nesse caso, os valores a, b, c, d e e seriam parâmetros ajustáveis. Durante o treinamento, o modelo testa diferentes combinações desses valores para produzir previsões cada vez mais próximas das respostas corretas.

Esse processo envolve uma escolha importante: nem toda informação do mundo real precisa entrar no modelo, e nem toda informação disponível é útil. Se quisermos prever desempenho em uma prova, talvez a cor do caderno não ajude muito; já horas de estudo, quantidade de questões resolvidas e domínio prévio provavelmente ajudam. Escolher boas features é uma forma de decidir quais aspectos da realidade serão visíveis para o modelo.

Abstrair é escolher: Representar um problema não significa copiar toda a realidade para dentro do computador (assim como os nossos olhos biológicos não enxergam as frequências do infravermelho ou ultravioleta, filtrando apenas o estreito espectro de luz visível que nos é útil para sobrevivência). Significa escolher quais características são estritamente relevantes para a pergunta que queremos responder. Em Machine Learning, abstrair é transformar uma situação complexa em uma forma simplificada, numérica e processável para a máquina.

2.1. O isolamento entrópico: humanos e IAs como ilhas de ordem

Para compreendermos o porquê da urgência vital de extrairmos features seletivas em vez de absorvermos o mundo inteiro, precisamos olhar para um princípio profundo que une a física, a biologia e a Inteligência Artificial: o papel fundamental do isolamento termodinâmico.

A Segunda Lei da Termodinâmica afirma que a tendência natural e inexorável do Universo é o aumento do caos e da desordem — a entropia. Nós, organismos vivos e inteligentes, existimos exclusivamente porque somos o que a física chama de ilhas de entropia negativa (neguentropia). Mantemos um altíssimo nível de ordem informacional interna para nos mantermos lúcidos e vivos.

Por isso, sistemas vivos não interagem com o mundo de forma ilimitada. Eles mantêm fronteiras, filtros e mecanismos de seleção que permitem trocar energia e informação com o ambiente sem perder sua organização interna. Em outras palavras, perceber não é absorver tudo: é selecionar sinais úteis
e transformá-los em uma estrutura que o organismo consiga processar.

De forma análoga, um modelo de IA também não lida com a totalidade crua do mundo externo. Uma rede neural algorítmica opera como uma bolha matemática fechada, estritamente estruturada. Ela não interage cruamente com a infinidade de dados caóticos do ruído do mundo exterior sem colapsar em erros infinitesimais. A máquina apenas interage com o mundo de forma
isolada, através de entradas e “fronteiras” rigidamente selecionadas por nós (as features). Exatamente como ocorre conosco, a Inteligência Artificial depende de um isolamento sistêmico nas suas bordas para conseguir assimilar ordem, sobreviver à entropia aleatória dos dados e gerar
pensamento coeso.

Aplicabilidade: features - A mesma lógica de abstração e isolamento aparece em filtros de spam, análise de crédito, diagnóstico médico, recomendação de vídeos, busca na internet e reconhecimento de imagens. Em todos esses casos, algo caótico e real precisa virar uma representação numérica estruturada que o computador consiga comparar, calcular e aprender.

3. Como um modelo aprende?

Em geral, podemos pensar em cada exemplo como um par: uma entrada e uma resposta esperada. A entrada é formada pelas features, como horas de estudo, idade, palavras ou pixels. A resposta esperada é chamada de target: pode ser uma nota, uma classe, uma probabilidade ou uma categoria. O modelo tenta aprender uma relação entre entrada e target.

Um modelo pode ser visto como uma função ajustável. Ele recebe dados de entrada, produz uma previsão e compara essa previsão com a resposta correta. A diferença entre o valor previsto e o valor real é o erro. Durante o treinamento, o modelo ajusta seus parâmetros interligados para diminuir esse erro.

Por exemplo, se um modelo tenta prever a nota de um estudante e erra muito, esse erro indica que seus parâmetros ainda não representam bem a relação entre as features e o desempenho. O treinamento é justamente o processo de buscar parâmetros melhores.

Esse erro costuma ser medido por uma função de custo, também chamada de função de perda. Ela transforma os erros individuais em um único valor que representa o desempenho geral do modelo. Quanto menor esse valor, melhor o modelo está se ajustando aos dados de treino. Em uma leitura
mais filosófica, reduzir gradativamente a função de perda pode ser visto como uma tentativa de extrair ordem do ruído: o modelo começa errando, mede esse erro e ajusta seus parâmetros até encontrar uma estrutura mais estável nos dados: é a busca incansável para diminuir a desordem (o erro) das nossas predições e encontrar estabilidade lógica num Universo que parece entregar pura aleatoriedade.

Contudo, aprender bem os dados de treino não significa necessariamente aprender bem o problema. Um modelo pode decorar padrões muito específicos dos exemplos apresentados e ter dificuldade com dados novos. Esse fenômeno é chamado de overfitting. Por isso, em aplicações reais, é comum separar dados de treino e dados de teste: os primeiros ajudam o modelo a aprender a ordem; os segundos verificam se ele consegue generalizar essa ordem no mundo real.

Essa ideia também mostra que Machine Learning não é “mágica”. O modelo não recebe consciência nem entendimento humano. Ele ajusta relações matemáticas a partir dos padrões presentes nos dados. Se os dados forem ruins, incompletos ou enviesados, o modelo também tende a produzir
resultados ruins, incompletos ou enviesados

4. Aplicabilidade e Conclusão

A premissa de transformar aspectos do mundo real em representações numéricas impulsiona muitos sistemas de IA usados atualmente.

Em diferentes áreas, como saúde, engenharia, educação, análise de dados e recomendação de conteúdo, o ponto comum é o mesmo: o modelo só consegue aprender aquilo que foi metodicamente representado. Por isso, antes de pensar em algoritmos complexos, é fundamental compreender como informações reais se tornam dados, como esses dados carregam padrões e como a qualidade dessa representação influencia diretamente o aprendizado.

Por isso, Machine Learning não se resume a linhas de código complexas ou matrizes algébricas gigantes para cálculos velozes. Ao compreendermos o elo formidável dessa área tecnológica com a termodinâmica, a biologia e a neurociência, um entendimento filosófico grandioso se revela.

A abstração analítica e a conversão do ambiente externo em sinais numéricos não são artifícios limitantes da tecnologia: a abstração é a própria essência que possibilita a fundação da inteligência no Universo, seja ela orgânica ou sintética.

Quando nós elegemos cuidadosamente as features e as conectamos às fronteiras de um modelo com a missão algorítmica vital de buscar a todo custo minimizar o erro, nós não estamos meramente desenvolvendo um software cego. De certo modo, estamos criando em silício uma versão matemática desse impulso fundamental: filtrar o caos, preservar padrões e construir ordem a partir de sinais dispersos. Estamos reerguendo laboriosas ilhas matemáticas num oceano de desordem universal; construímos modelos que, assim como nós, tateiam e sentem a gravidade da realidade por trás de
seus sensores em sua perpétua e majestosa batalha para produzir ordem, gerar clareza e, finalmente, encontrar sentido perante o infinito Universo.