Introdução à Estatística: Dados e Tipos de Variáveis

De forma historicamente bem grosseira, podemos dizer que a Estatística nasceu quando os governos tiveram interesse em coletar e organizar informações quantitativas e qualitativas sobre suas riquezas e populações. As primeiras medidas estatísticas listadas datam de registros egípcios sobre presos de guerra entre 5.000 e 3.000 a.C. (Almeida, 2022). Atualmente, a Estatística é um campo de trabalho importante para a análise e interpretação de dados em diversas outras áreas do conhecimento humano. Seu objetivo é transformar dados brutos em informações úteis para a tomada de decisões. Para isso, é essencial compreender o que são dados e os tipos de variáveis.

O que são Dados?

Dados são registros coletados sobre determinado fenômeno, evento ou população. Eles podem ser obtidos por meio de observações, experimentos ou levantamentos. Os dados podem ser organizados em tabelas, gráficos ou resumidos por medidas numéricas que facilitem sua análise. Por exemplo, em uma pesquisa sobre estudantes de uma instituição de ensino pode-se coletar dados como idade, sexo, curso, nota final dentre outros.

Para Pinheiro et al. (2009, p. 2), o esforço de analisar dados pode ser descrito de três formas: 1) identificar comportamentos médios e discrepantes, comparar estes comportamentos, investigar a interdependência entre variáveis, revelar tendências etc.; 2) a partir de uma massa de dados, e com o auxílio dos recursos computacionais, separar o que é essencial (estrutura) do que é eventual (ruído); e 3) resumir, de forma eficiente, a informação contida nos dados e assim permitir que, através desse conhecimento, as decisões sejam tomadas de forma mais consciente.

Independentemente da descrição de Pinheiro et al. (2009) que você opte seguir, para analisar dados será necessário utilizar variáveis que permitam a você observar os dados coletados durante a pesquisa.

Tipos de Variáveis

As variáveis são características observadas ou medidas nos elementos de uma população ou amostra. Elas podem ser classificadas de duas formas, de acordo com Bussab e Morettin (2012):

1. Quanto à natureza dos dados:

  • Qualitativas (ou categóricas): expressam uma qualidade, atributo ou categoria.
    • Nominais: não possuem ordem (ex: cor dos olhos, estado civil).
    • Ordinais: possuem uma ordem natural (ex: nível de escolaridade, grau de satisfação).
  • Quantitativas (ou numéricas): expressam uma quantidade ou valor numérico.
    • Discretas: assumem valores inteiros e contáveis (ex: número de filhos).
    • Contínuas: assumem qualquer valor dentro de um intervalo (ex: altura, peso, tempo).

2. Quanto à função na análise estatística:

  • Variáveis independentes: manipuladas ou controladas para observar seus efeitos.
  • Variáveis dependentes: respondem às alterações das variáveis independentes.

Por enquanto vamos discutir as variáveis apenas pelo viés dos dados e deixaremos a discussão da função na análise estatística para outro artigo. Para compreendermos melhor a classificação das variáveis quanto à natureza dos dados, suponha o seguinte exemplo: um pesquisador está interessado em fazer um levantamento sobre alguns aspectos socioeconômicos dos empregados do departamento de orçamentos da Companhia MB. Usando dados obtidos no departamento pessoal, ele elaborou as Tabelas 1 e 2.

VariávelRepresentação
Estado civilX
Grau de instruçãoY
Número de filhosZ
SalárioS
IdadeU
Região de procedênciaV
Tabela 1 – Relação de variáveis observadas pelo pesquisador.
Fonte: Retirado de Bussab e Morettin (2012).
IDEstado civilGrau de instruçãoNº de filhosSalário (x sal. mín.)IdadeRegião de procedência
1Solteirofundamental4,0026interior
2Casadofundamental14,5632capital
3Casadofundamental25,2536capital
4Solteiromédio5,7320outra
5Solteirosuperior6,2640outra
6Solteirosuperior36,8042capital
Tabela 2 – Relação das variáveis observadas e alguns valores obtidos durante a pesquisa.
Fonte: Adaptado de Bussab e Morettin (2012).

Quando se estuda uma variável, o principal interesse é conhecer o comportamento dessa variável, analisando a ocorrência de suas possíveis realizações. A partir do conjunto de dados, pode-se construir um resumo da distribuição de frequências da variável. Seguindo o cenário hipotético desse artigo, considere a Tabela 3 como um exemplo de distribuição de frequências da variável Grau de Instrução descrita na Tabela 2.

Variável: Grau de instruçãoFrequência absoluta (ni)Proporção ou frequência relativa (fi = ni / n)Porcentagem (100 x fi)
Fundamental
Médio
Superior
3
1
2
0,5000
0,1666
0,3333
50,00
16,67
33,33
Total61,0000100,00
Tabela 3 – Tabela de distribuição de frequências da variável Grau de instrução.
Fonte: Adaptado de Bussab e Morettin (2012).

Esse tipo de tabela pode ser problemático quando a variável é contínua, pois os valores precisam ser agrupados em faixas de valores, considerando que os dados podem oscilar de forma acentuada entre si. Nestes casos, a escolha dos “intervalos é arbitrária e a familiaridade do pesquisador com os dados é que lhe indicará quantas e quais classes (intervalos) devem ser usadas.” (Bussab e Morettin, 2012, p. 13).

Considerações finais

O conhecimento sobre dados e tipos de variáveis é necessário para iniciarmos qualquer análise estatística. Saber identificar corretamente os tipos de variáveis com as quais estamos lidando e aplicar técnicas adequadas permite que interpretemos os dados com mais clareza. Assim, teremos condições de fazer inferências mais complexas e tomar decisões menos infundadas.

Obrigado pela leitura e bons estudos.

Referências

ALMEIDA, Amanda Montezano de. Origem da Estatística. 2022. Disponível em: <https://estatjr.com.br/2022/10/11/origem-da-estatistica/>. Acesso em: 05 mai. 2025.

BUSSAB, Wilton de Oliveira; MORETTIN, Pedro Alberto. Estatística básica. 7ª ed. São Paulo: Saraiva. 2012.

GOMES, Aline Ester. In: Blog da Profa. Fernanda Maciel. Interpretando um gráfico de dispersão. Disponível em: <https://blog.proffernandamaciel.com.br/interpretar-grafico-de-dispersao/>. Accesso em: 04 mai. 2025.

PINHEIRO, João Ismael D. [et al.] Estatística básica: a arte de trabalhar com dados. Rio de Janeiro: Elsevier, 2009.