Introdução à Estatística: Dados e Tipos de Variáveis
De forma historicamente bem grosseira, podemos dizer que a Estatística nasceu quando os governos tiveram interesse em coletar e organizar informações quantitativas e qualitativas sobre suas riquezas e populações. As primeiras medidas estatísticas listadas datam de registros egípcios sobre presos de guerra entre 5.000 e 3.000 a.C. (Almeida, 2022). Atualmente, a Estatística é um campo de trabalho importante para a análise e interpretação de dados em diversas outras áreas do conhecimento humano. Seu objetivo é transformar dados brutos em informações úteis para a tomada de decisões. Para isso, é essencial compreender o que são dados e os tipos de variáveis.
O que são Dados?
Dados são registros coletados sobre determinado fenômeno, evento ou população. Eles podem ser obtidos por meio de observações, experimentos ou levantamentos. Os dados podem ser organizados em tabelas, gráficos ou resumidos por medidas numéricas que facilitem sua análise. Por exemplo, em uma pesquisa sobre estudantes de uma instituição de ensino pode-se coletar dados como idade, sexo, curso, nota final dentre outros.
Para Pinheiro et al. (2009, p. 2), o esforço de analisar dados pode ser descrito de três formas: 1) identificar comportamentos médios e discrepantes, comparar estes comportamentos, investigar a interdependência entre variáveis, revelar tendências etc.; 2) a partir de uma massa de dados, e com o auxílio dos recursos computacionais, separar o que é essencial (estrutura) do que é eventual (ruído); e 3) resumir, de forma eficiente, a informação contida nos dados e assim permitir que, através desse conhecimento, as decisões sejam tomadas de forma mais consciente.
Independentemente da descrição de Pinheiro et al. (2009) que você opte seguir, para analisar dados será necessário utilizar variáveis que permitam a você observar os dados coletados durante a pesquisa.
Tipos de Variáveis
As variáveis são características observadas ou medidas nos elementos de uma população ou amostra. Elas podem ser classificadas de duas formas, de acordo com Bussab e Morettin (2012):
1. Quanto à natureza dos dados:
- Qualitativas (ou categóricas): expressam uma qualidade, atributo ou categoria.
- Nominais: não possuem ordem (ex: cor dos olhos, estado civil).
- Ordinais: possuem uma ordem natural (ex: nível de escolaridade, grau de satisfação).
- Quantitativas (ou numéricas): expressam uma quantidade ou valor numérico.
- Discretas: assumem valores inteiros e contáveis (ex: número de filhos).
- Contínuas: assumem qualquer valor dentro de um intervalo (ex: altura, peso, tempo).
2. Quanto à função na análise estatística:
- Variáveis independentes: manipuladas ou controladas para observar seus efeitos.
- Variáveis dependentes: respondem às alterações das variáveis independentes.
Por enquanto vamos discutir as variáveis apenas pelo viés dos dados e deixaremos a discussão da função na análise estatística para outro artigo. Para compreendermos melhor a classificação das variáveis quanto à natureza dos dados, suponha o seguinte exemplo: um pesquisador está interessado em fazer um levantamento sobre alguns aspectos socioeconômicos dos empregados do departamento de orçamentos da Companhia MB. Usando dados obtidos no departamento pessoal, ele elaborou as Tabelas 1 e 2.
Variável | Representação |
Estado civil | X |
Grau de instrução | Y |
Número de filhos | Z |
Salário | S |
Idade | U |
Região de procedência | V |
Fonte: Retirado de Bussab e Morettin (2012).
ID | Estado civil | Grau de instrução | Nº de filhos | Salário (x sal. mín.) | Idade | Região de procedência |
1 | Solteiro | fundamental | – | 4,00 | 26 | interior |
2 | Casado | fundamental | 1 | 4,56 | 32 | capital |
3 | Casado | fundamental | 2 | 5,25 | 36 | capital |
4 | Solteiro | médio | – | 5,73 | 20 | outra |
5 | Solteiro | superior | – | 6,26 | 40 | outra |
6 | Solteiro | superior | 3 | 6,80 | 42 | capital |
Fonte: Adaptado de Bussab e Morettin (2012).
Quando se estuda uma variável, o principal interesse é conhecer o comportamento dessa variável, analisando a ocorrência de suas possíveis realizações. A partir do conjunto de dados, pode-se construir um resumo da distribuição de frequências da variável. Seguindo o cenário hipotético desse artigo, considere a Tabela 3 como um exemplo de distribuição de frequências da variável Grau de Instrução
descrita na Tabela 2.
Variável: Grau de instrução | Frequência absoluta (ni) | Proporção ou frequência relativa (fi = ni / n) | Porcentagem (100 x fi) |
Fundamental Médio Superior | 3 1 2 | 0,5000 0,1666 0,3333 | 50,00 16,67 33,33 |
Total | 6 | 1,0000 | 100,00 |
Fonte: Adaptado de Bussab e Morettin (2012).
Esse tipo de tabela pode ser problemático quando a variável é contínua, pois os valores precisam ser agrupados em faixas de valores, considerando que os dados podem oscilar de forma acentuada entre si. Nestes casos, a escolha dos “intervalos é arbitrária e a familiaridade do pesquisador com os dados é que lhe indicará quantas e quais classes (intervalos) devem ser usadas.” (Bussab e Morettin, 2012, p. 13).
Considerações finais
O conhecimento sobre dados e tipos de variáveis é necessário para iniciarmos qualquer análise estatística. Saber identificar corretamente os tipos de variáveis com as quais estamos lidando e aplicar técnicas adequadas permite que interpretemos os dados com mais clareza. Assim, teremos condições de fazer inferências mais complexas e tomar decisões menos infundadas.
Obrigado pela leitura e bons estudos.
Referências
ALMEIDA, Amanda Montezano de. Origem da Estatística. 2022. Disponível em: <https://estatjr.com.br/2022/10/11/origem-da-estatistica/>. Acesso em: 05 mai. 2025.
BUSSAB, Wilton de Oliveira; MORETTIN, Pedro Alberto. Estatística básica. 7ª ed. São Paulo: Saraiva. 2012.
GOMES, Aline Ester. In: Blog da Profa. Fernanda Maciel. Interpretando um gráfico de dispersão. Disponível em: <https://blog.proffernandamaciel.com.br/interpretar-grafico-de-dispersao/>. Accesso em: 04 mai. 2025.
PINHEIRO, João Ismael D. [et al.] Estatística básica: a arte de trabalhar com dados. Rio de Janeiro: Elsevier, 2009.