Em Bioestatística, estudamos a coletânea, tratamento e análise de dados, a fim de estabelecer correlações e estudar a influência de uma variável em um processo biológico. Para introduzir este estudo, vamos começar delimitando as condições que cercam objeto em análise, nossas variáveis e hipóteses experimentais.
1. Tipo de variável:
As variáveis podem ser quantitativas ou qualitativas.
1.1. Variáveis quantitativas: são variáveis que podem assumir valores numéricos. Essas variáveis podem ser classificadas como:
1.1. a) Discretas: são aquelas que só podem assumir determinados valores numéricos, pertencentes a um conjunto discreto . Dados dois valores e pertencentes a e tal que existe porém não está contido no conjunto , a variável não pode assumir o valor . Isso significa dizer que se e são o menor intervalo entre si contido em , a variável pode assumir ou , mas nenhum valor entre estes. Um exemplo muito usado em Biologia são variáveis discretas para intervalos de números naturais. Neste caso, , porém, não pode assumir nenhum valor fracionário entre dois números naturais, por isso é dito discreto ou não contínuo. Exemplos de variáveis discretas: número de pétalas em flores, quantidade de filhotes por ninhada.
1.1. b) Contínuas: são aquelas que podem assumir infinitos valores entre dois outros de um intervalo, i.e., estão contidas no conjunto dos números reais ou em um subconjunto deste. Dados dois valores e , existe infinitos valores no intervalo tal que , a variável pode assumir o valor . Exemplos de variáveis contínuas: massa corporal, densidade óssea, altura.
1.2. Variáveis qualitativas: são aquelas que não podem assumir valores numéricos, mas sim são classificadas nominalmente ou segundo sua ordem. Essas variáveis podem ser classificadas como:
1.2.1. a) Ordinais: são aquelas cujo as categorias podem ser ordenadas. Exemplo: grau de escolaridade, nível de dor.
1.2.1. b) Nominais: são aquelas cujo as categorias não podem ser ordenadas, pois não possuem ordem natural, cronologia ou hierarquia entre as categorias. Exemplo: gênero, tipagem sanguínea, cor dos olhos.
1.2.2. a) Dicotômicas: são aquelas cujo a classificação é binária, devendo se encaixar em uma categoria, excluída desta, automaticamente sendo classificada na outra. Exemplo: fumante: sim ou não.
1.2.2. b) Categóricas: são aquelas cujo a classificação é multicategórica. Exemplo: cor dos olhos: azul, verde, castanho claro, castanho escuro, etc.
As variáveis podem assumir diferentes categorias de acordo com os objetivos do estudo, podendo a mesma variável ser medida quantitativamente ou qualitativamente. Por exemplo, para medir o uso de álcool como fator variante podemos perguntar:
- Nominal: "O indivíduo faz uso de bebidas alcóolicas?" (Respostas: SIM ou NÃO)
- Ordinal: "Quanto de álcool o indivíduo ingere?" (Respostas: NADA, POUCO, MÉDIO ou MUITO)
- Discreta: "Quantos copos de álcool foram ingeridos na semana?" (Respostas: )
- Contínuas: "Quantidade de álcool presente na corrente sanguínea no momento de aferição" (Respostas: mg/L ).
2. O estudo estatístico:
Para determinar as variáveis do nosso estudo, ainda é preciso saber a correlação entre elas (causa e consequência). Chamamos de variável independente aquelas que queremos estudar a influência sobre as demais, ou seja, são as causais; e chamamos variável dependente aquelas que medem os efeitos esperados, ou seja, servem como objeto de estudo das consequências das variáveis independentes. Como exemplo, uma variável independente pode ser a ingestão de microplásticos, e as variáveis dependentes deste estudo são a resposta inflamatória gerada pelo microplástico no sistema respiratório (bronquíolos), produção de anticorpos (IgA e IgE), etc.
Classificar as variáveis segundo os critérios 1.1., 1.2.1., permite verificar o método mais adequado para análise: estatística descritiva ou analítica.
2.1. Estatística descritiva: se preocupa com o tratamento dos dados quantitativos de forma matemática, estudando a média, mediana (distribuição), desvio padrão e variância. Estuda o levantamento, organização, classificação, descrição e cálculo de parâmetros representativos.
2.2. Estatística analítica: se preocupa em estudar se as variáveis são ou não significativas. Estuda a formulação de hipóteses e interferência estatística (grau de significância).
3. Amostragem:
Por fim, é preciso selecionar um grupo de indivíduos que servirá de dados experimentais para o estudo em questão. Essa seleção leva em conta as hipóteses que serão testadas e o grau de significância exigido, o que será tratado em outra aula. Primeiro, vamos definir alguns conceitos:
3.1. População: em estatística, população é o mesmo que o conjunto universo () dos indivíduos, ou seja, abrange todos os indivíduos da Biosfera que se enquadram na categoria da pesquisa. Não confundir com o conceito de população em Biologia, que se refere ao conjunto de indivíduos de uma mesma espécie em um determinado local. Por exemplo, se escolhermos estudar o comportamento reprodutivo das cobras do gênero Naja, a população é o conjunto de todas as Najas do planeta Terra.
3.2. Amostra: é o conjunto dos indivíduos escolhidos dentre a população que serão objeto de estudo, representando toda a população. Sendo inviável economicamente analisar todos os indivíduos de uma espécie, escolhemos um grupo que será o alvo das nossas pesquisas. Para que os indivíduos da amostra de fato representem a população em suas particularidades e o experimento seja conclusivo, deve-se determinar o perfil da amostragem. Do contrário, para uma amostra manipulada, o resultado pode ser adulterado.
3.2.a) Levando em conta o perfil de uma amostra, os resultados do estudo devem ser delimitados à este perfil. Caso a população seja muito diversa e queira expressar-se esse diversidade na pesquisa, é necessário ter um valor significativo de indivíduos que apresentem cada subclassificação da população. Tais variâncias devem ser relatadas nas conclusões do experimento.
3.2.b) O tamanho da amostra e a margem de erro determinam o grau de confiança de uma pesquisa. Em Biologia, é exigido para que a pesquisa tenha confiabilidade uma amostra de no mínimo 20 indivíduos e nível de confiança de 95%. Como obter estes valores, será explicado em uma outra aula.
Um estudo sério deve permitir que as conclusões obtidas à partir da amostra sejam extrapoladas para o universo, com uma margem de erro dentro do aceitável para o experimento (em geral, até 5%).
Por Luiza Lanza