Teste de hipóteses para proporção
O teste de hipóteses é um procedimento estatístico usado para avaliar se uma afirmação sobre uma população é compatível com os dados observados em uma amostra. Em termos práticos, ele ajuda o pesquisador a decidir se uma diferença, uma melhoria, uma associação ou um efeito observado nos dados pode ser tratado como evidência estatística ou se pode ter ocorrido apenas por variação aleatória.
Contudo, este artigo é focado em demonstrar o teste de hipótese para cenários em que estamos trabalhando com proporção. Caso você esteja começando no assunto, recomendamos ler nosso artigo introdutório:
Para ler mais sobre a parte introdutória dos testes de hipóteses, clique aqui.
Conceito e fundamentação matemática
O teste de hipóteses para proporção é utilizado quando a variável analisada representa uma ocorrência do tipo “sim ou não”, “sucesso ou fracasso”, “clicou ou não clicou”, “converteu ou não converteu”, “aprovou ou reprovou”. Em Computação, esse tipo de teste é comum em experimentos A/B, avaliação de taxa de erro, análise de conversão em interfaces, proporção de testes automatizados aprovados ou proporção de usuários que adotaram determinada funcionalidade.
Nesse caso, o parâmetro de interesse é a proporção populacional, geralmente representada por ( p ). A hipótese nula estabelece um valor de referência para essa proporção, representado por ( ). A partir de uma amostra de tamanho ( ), calcula-se a proporção amostral ( ), que representa a fração observada de sucessos na amostra.
Segundo Bussab e Morettin (2017), a lógica inferencial consiste em verificar se a diferença entre ( ) e ( ) é pequena o suficiente para ser atribuída à variabilidade amostral ou grande o bastante para fornecer evidência contra ( ).
A proporção amostral ( ) é calculada por:
Nessa expressão, ( x ) representa o número de ocorrências de interesse na amostra, enquanto ( n ) representa o tamanho total da amostra.
Para amostras suficientemente grandes, a distribuição amostral de ( ) pode ser aproximada por uma distribuição normal. Essa aproximação decorre do Teorema Central do Limite e permite transformar a proporção observada em uma estatística padronizada Z (MOORE; McCABE; CRAIG, 2017). No teste para uma proporção, a estatística de teste é dada por:
O denominador da fórmula é o erro padrão da proporção sob a hipótese nula:
Observe que o erro padrão é calculado usando ( ), e não ( ). Isso ocorre porque o teste avalia a compatibilidade dos dados observados com a hipótese nula. Portanto, a pergunta matemática é: “se ( ) fosse verdadeira, quão distante a proporção amostral observada estaria do valor esperado?”.
Exemplo prático
Considere o seguinte exemplo. A empresa BRSistemas tinha uma taxa histórica de conversão de 12% em uma página de matrícula. Após uma alteração na interface, a equipe observou que, entre 500 usuários, 75 realizaram matrícula. A pergunta é se a nova interface aumentou a proporção de conversão. Nesta situação, as hipóteses são:
Como a hipótese alternativa afirma que a proporção aumentou, trata-se de um teste unilateral à direita.
Primeiro, calcula-se a proporção amostral:
A proporção observada foi de 15%. Agora calcula-se o erro padrão sob ( ):
Em seguida, calcula-se a estatística Z:
Agora calcula-se o valor-p. Como o teste é unilateral à direita, o valor-p corresponde à probabilidade de observar um valor de Z maior ou igual ao valor calculado:
Pela tabela da distribuição normal padrão com uso da Interpolação Linear, ou por software estatístico, temos aproximadamente que:
Logo:
Se o nível de significância adotado for 5%, temos . Comparando o p-valor com o alfa:
Como o valor-p é menor que o nível de significância, rejeita-se ( ). Assim, há evidência estatística, ao nível de 5%, de que a nova interface aumentou a proporção de conversão.
A interpretação em linguagem aplicada seria: “considerando a amostra de 500 usuários, na qual 75 realizaram matrícula, a proporção amostral foi de 15%. Como o valor-p foi aproximadamente 0,0195, menor que 0,05, os dados indicam evidência estatística de aumento na taxa de conversão em relação ao valor histórico de 12%”.
Retomando um conceito sobre o valor-p
Cabe reforçarmos/relembrarmos que a fórmula do valor-p depende da direção da hipótese alternativa. Para um teste unilateral à direita, usa-se:
Para um teste unilateral à esquerda, usa-se:
Para um teste bilateral, usa-se:
O teste bilateral é utilizado quando a hipótese alternativa afirma apenas que a proporção é diferente do valor de referência, sem indicar previamente se será maior ou menor:
De forma bem, bem simplória, podemos resumir o cálculo do valor-p em um teste para proporção como sendo a sequência de quatro etapas principais:
- calcular a proporção amostral ( ),
- calcular o erro padrão com base em ( ),
- obter a estatística padronizada Z e,
- consultar a probabilidade correspondente na distribuição normal padrão ou num software estatístico.
O valor-p resultante dos passos indicados indicará o quanto a proporção observada é compatível com a hipótese nula.
Conclusão
Encaminhando a leitura deste artigo para o final, precisamos destacar uma coisa: em teste de hipótese para proporção, quando a amostra é pequena, normalmente não trocamos a estatística Z (normal) por t de Student.
A distribuição t de Student aparece principalmente em testes para média, quando o desvio padrão populacional ( ) é desconhecido e usamos o desvio padrão amostral ( ) no lugar. No teste para proporção, o fenômeno básico é binomial, ou seja, cada observação costuma ser uma categoria ou classe: “sucesso” ou “fracasso”, por exemplo. Por isso, quando a amostra é pequena, o problema é que a aproximação normal pode ficar ruim. Nesse caso, o mais adequado costuma ser usar um teste binomial exato, baseado diretamente na distribuição binomial.
Seja como for, na área de Computação, testes de hipóteses ajudam a responder perguntas práticas como: uma API ficou mais rápida? Um algoritmo é mais eficiente? Uma interface converte mais usuários? Uma nova versão reduziu erros? Em todos esses casos, o teste estatístico impede que decisões sejam tomadas apenas pela aparência dos números.
Obrigado pela leitura e bons estudos!
Referências
BUSSAB, Wilton de O.; MORETTIN, Pedro A. Estatística básica. 9. ed. São Paulo: Saraiva, 2017.
MOORE, David S.; McCABE, George P.; CRAIG, Bruce A. Introduction to the practice of statistics. 9. ed. New York: W. H. Freeman, 2017.


