Distribuições de variáveis

Nas duas últimas aulas, nos dedicamos a estudar como classificar e definir variáveis, agrupá-las e tratá-las. Agora, nos resta saber como tirar conclusões em cima da nossa pesquisa. Para isso, precisamos conhecer a forma como as variáveis se distribuem, para escrever funções e prever casos futuros. Além disso, a distribuição das variáveis nos fornece a significância da medida.

Ao plotar os dados em uma curva de probabilidade, observa-se que ela segue um padrão, na maioria das vezes, semelhantes à um sino (campanário) e é simétrico:
A grande questão é: qual função descreve esta curva e nos permite fazer previsões? Para isso, vamos estudar as três teorias de distribuição de probabilidades mais convenientes para nossa análise.

1. Modelo binomial

O modelo binomial é uma distribuição baseada no Binômio de Newton, que nada mais é que uma maneira para escrever a forma canônica de um polinômio de grau n. Relembrando:

(a+b)^n=\sum^n_{k=0}\binom{n}{k}a^{n-k}b^k

O modelo de distribuições binomial serve para variáveis dicotômicas e independentes, ou seja, só há duas respostas possíveis e uma ocorrência não influencia próxima. Ou seja, P(A|B)=P(A), a probabilidade de ocorrer A dado que ocorreu B é igual a probabilidade de ocorrer A, já que são eventos independentes, e P(A)+P(B)=1. Um caso típico é a chance de um casal ter uma menina dado que eles já têm um filho homem, a probabilidade é 50\% , já que os eventos são independentes: a cada nova fecundação a probabilidade do óvulo ser XX ou XY é a mesma.

Seja P a probabilidade de sucesso de um evento, i.e., a probabilidade que ele ocorra dado o espaço amostral. Dessa forma, (1-p) é a chance de fracasso. Considerando x o número de sucessos em n realizações, se x tem distribuição binomial, a probabilidade de sucesso é de:

P(X=x)=\binom{n}{x}p^x(1-p)^{n-x}|\ x\in \mathbb{N}

https://www.researchgate.net/figure/Figura-31-Graficos-da-distribuicao-binomial_fig2_255665114

Ou seja, interpretando a função, temos que para x sucessos em n casos, distribuidos aleatoriamente, há \binom{n}{x} maneiras de escolher como distribuir esses valores em n casos.

Como a distribuição binomial é uma distribuição de probabilidades, a soma de toda a área sob a curva é 1.

Exemplo retirado de https://www.inf.ufsc.br/~andre.zibetti/probabilidade/binomial.html: Baseado em estudos anteriores, a probabilidade de um certo componente elétrico estar em condições operacionais satisfatórias é de 0.98. Os componentes são amostrados item por item, a partir de uma produção (contínua). Em uma amostra de cinco componentes, quais são as probabilidades de se encontrarem,

  1. zero;
  2. exatamente um;
  3. exatamente dois;
  4. dois ou mais;
  5. ao menos quatro, itens defeituosos?

Respostas: Para isso, basta aplicar a fórmula da distribuição binomial, utilizando p=0.98, (1-p)=0.02 e aplicando o valor de X=5-x (número de sucessos) para cada situação. Então:

  1. P(X=5)=\binom{5}{5}0.98^5\cdot0.02^{0}=0.9039207968
  2. P(X=4)=\binom{5}{4}0.98^4\cdot0.02^{1}=0.0922368160
  3. P(X=3)=\binom{5}{3}0.98^3\cdot0.02^{2}=0.0037647680
  4. P(X=2)=\binom{5}{2}0.98^2\cdot0.01^{3}=0,0000768320
  5. P(X=1)=\binom{5}{1}0.98^1\cdot0.02^{4}=0,0000007842

O modelo binomial é bastante útil em distribuições de genética mendeliana.

(Retirado do livro Introdução à Bioestatística) "Exemplo 4.2.2: De acordo com a teoria Mendeliana da hereditariedade de caracteres, um cruzamento de determinada espécie de plantas com flores vermelhas e brancas, produz uma nova planta que tem 25% de chance de ter flores vermelhas. Dois cruzamentos essa espécie de plantas foram realizados. Seja X o número de plantas com flores vermelhas. a variável aleatória X~B(2, 1/4) pois: (a) cada planta produz flores vermelhas (V) ou brancas (B) (dicotomia de eventos); (b) P(V)=1/4 é constante em cada realização do experimento (os eventos são independentes). A distribuição de probabilidade de X é:

P(X=x)=\binom{2}{x}(\frac{1}{4})^x(\frac{3}{4})^{2-x},\ x=1,2,3...

Calculando-se P(X=x) para cada x, obtêm-se [...]:

P(X=0)=\binom{2}{0}(\frac{1}{4})^0(\frac{3}{4})^{2}=1\times 1\times \frac{9}{16}

P(X=1)=\binom{2}{1}(\frac{1}{4})^1(\frac{3}{4})^{1}=2\times \frac{1}{4}\times \frac{3}{4}= \frac{6}{16}

P(X=2)=\binom{2}{2}(\frac{1}{4})^2(\frac{3}{4})^{0}=1\times \frac{1}{16}\times 1=\frac{1}{16}

Observe que a ocorrência de nenhuma planta com flores vermelhas, i.e., X=0, equivale ao evento duas plantas com flores brancas (B\cap B) e a probabilidade desse evento é:

P(B\cap B)=\frac{3}{4}\times\frac{3}{4}=\frac{9}{16}

As demais probabilidades poderiam ser obtidos de maneira análoga.

A distribuição de probabilidade de X está apresentada graficamente na Figura abaixo.

Modelo de Poisson

É utilizado quando sabe-se para representar o número de ocorrências, de forma discreta, de um evento por intervalo de tempo. Nessa distribuição, a taxa de variação ocorrências aferidas por intervalo de tempo deve ser aproximadamente constante (ex.: número de isótopos que sofrem decaimento radioativo por intervalo de tempo: tempo de meia-vida). A distribuição de Poisson é dada por:

P(X=x)=\frac{e^{-\lambda}\lambda^x}{x!}|\ x\in\mathbb{N}

Modelo normal ou gaussiano

É o modelo mais usual e que melhor descreve as variáveis biológicas, por isso, é chamado de "normal". Cada distribuição pode ser completamente descrita pela média aritmética das variáveis e o desvio padrão, uma vez que:

z_i=\frac{x_i-\bar{x}}{\sigma}\ \forall i\in \mathbb{N}

\therefore x_i=z_i\cdot \sigma+\bar{x}

A função que descreve a curva de distribuição é dada por:

f(x)=\frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\bar{x})^2}{2\sigma^2}}

Porém, é mais comum a representação da média aritmética pela letra grega \mu, sendo possível encontrar a expressão como:

f(x)=\frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}}

Como essa é uma distribuição de probabilidades, a área sob a curva é 1. Assim, se queremos saber a probabilidade de uma variável assumir uma valor que está contido em um intervalo [a,b], basta efetuar:

 E = \int_{a}^{b} \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}} dx

Por fim os intervalor mais importantes são [\mu-\sigma, \mu +\sigma], [\mu-2\sigma, \mu +2\sigma], [\mu-3\sigma, \mu +3\sigma], que representam respectivamente 68,3\%, 95,4\% e 99,7\% da distribuição.

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/normal.html

Processo Seletivo Exclusivo do ISMART para Alunos Olímpicos

Fala, olímpicos!

O ISMART (Instituto Social para Motivar, Apoiar e Reconhecer Talentos), parceiro do NOIC, está abrindo o Processo Seletivo Exclusivo para Jovens Talentos, no qual o candidato poderá apresentar suas conquistas em olimpíadas científicas. Essa é uma oportunidade imperdível para vocês, medalhistas do NOIC.

O objetivo deste processo seletivo é encontrar jovens talentosos de baixa renda que assim poderão ter acesso a bolsas integrais em excelentes colégios privados em SP, BH e RJ, tanto presencialmente quanto virtualmente. O processo é totalmente gratuito e online, e visa aos candidatos pertencentes às seguintes categorias:

  • Alunos do 7º e 9º ano do Ensino Fundamental
  • Que residam em Belo Horizonte, Rio de Janeiro, São Paulo, São José dos Campos (SP), Cotia (SP), Sorocaba (SP) ou regiões próximas dessas localidades
  • Estudantes com excelente desempenho acadêmico e desejo de crescer

Além disso, o projeto também oferece um programa de acompanhamento e desenvolvimento pessoal e profissional que pode continuar até a Universidade. Os jovens selecionados também terão auxílio financeiro para alimentação, transporte, material didático e uniforme.

Os estudantes medalhistas que se inscreverem pelo NOIC terão o benefício de poder “pular” a etapa do teste online e indo diretamente para a etapa da prova digital, conforme no esquema abaixo.

Ficou interessado? Então acesse o link e não deixe de se inscrever!

Fique atento, pois a informações para a sua participação na Prova Digital* serão enviadas por email.

*A Prova Digital acontecerá no dia 15/09. Todo as etapas do processo acontecem 100% online.

Inscrições por tempo limitado. Não perca essa chance de transformar o seu futuro!

Materiais da semana (16/07-22/07)

Fala, olímpicos!

Confiram os mais novos materiais produzidos pelo NOIC nessa última semana:

Aproveitem os materiais e bons estudos!

 

Conheça o Prep Program da Fundação Estudar para alunos que querem estudar fora.

Falaaaaa, olímpicos!!

Recentemente, o NOIC formou uma parceria com a Fundação Estudar, dedicada ao incentivo à educação e atuando em diferentes áreas, como na formação de líderes e preparatório para aprovações em universidades no exterior.

Nesta área, o grupo Estudar Fora, interno à Fundação Estudar, abriu as pré-inscrições do Prep Program, preparatório gratuito para graduação no exterior, buscando auxiliar na orientação do processo de candidatura. O Prep Program levou a mais de 1200 aprovações, com o alto índice de 80% de aprovação de participantes em universidades dos EUA, incluindo as melhores do mundo, como Harvard, MIT, Stanford, Princeton e Yale. Abaixo, confiram algumas características do programa:

  • O público alvo trata-se de estudantes no penúltimo ou último ano do ensino médio com bons desempenhos acadêmicos e desempenho em inglês, principalmente.
  • Cada participante contará com um mentor que está cursando ou tenha cursado a graduação em uma universidade americana e com uma application advisor, especialista em aprovações, que o auxiliarão no processo de escrita de redações e atividades extracurriculares e também irão tirar dúvidas sobre estudar fora.
  • Estudantes contarão com reuniões semanais onde poderão aprender mais sobre o processo de aplicação para universidades americanas e assistir sessões informativas com oficiais de admissão de diversas universidades, como Harvard, Stanford e Johns Hopkins.
  • O Prep Program auxiliará financeiramente estudantes comprovadamente de baixa renda, financiando os testes de inglês e aptidão acadêmica do aluno, como SAT, TOEFL e DET, e os custos relacionados a taxas de inscrições e de envio de documentos financeiros para universidades.
  • O programa contará com aulas preparatórias para o SAT/ACT, o ENEM americano, e também possuirá diversas sessões onde estudantes poderão praticar a escrita e conversação da língua inglesa, o que é essencial para um bom desempenho em entrevistas e testes de proficiência em inglês.

Ficou ansioso(a) em poder participar do programa e garantir a aprovação na sua universidade dos sonhos? Então não perca essa oportunidade! Para mais informações e para realizar sua inscrição, acesse este link. Em breve, o NOIC também irá realizar um evento online e exclusivo para que nossos alunos tirem dúvidas sobre o processo de estudar fora junto com especialistas da Fundação Estudar.
Aproveite!