Poder estatístico — Glossário Aria Research

Definição estendida

Poder estatístico é a probabilidade de um teste estatístico rejeitar corretamente a hipótese nula $H_0$ quando ela é, de fato, falsa. Em notação, Poder = $1 - \beta$ , onde $\beta$ é a probabilidade de erro tipo II (falso negativo: aceitar $H_0$ falsa). O conceito foi formalizado no framework de Neyman-Pearson nos anos 1930 e operacionalizado para ciências comportamentais por Jacob Cohen no manual canônico Statistical Power Analysis for the Behavioral Sciences (1988), que estabeleceu a convenção de $1 - \beta = 0{,}80$ como padrão mínimo aceitável. Poder depende de quatro fatores interrelacionados: tamanho de efeito esperado, tamanho amostral, nível de significância $\alpha$ (tipicamente 0,05), e variância dos dados. Análise a priori calcula o $n$ necessário para detectar um efeito esperado com poder mínimo desejado. Análise post hoc (calcular poder a partir do efeito observado) é matematicamente possível mas amplamente criticada — não fornece informação adicional além do $p$ -valor.

Quando se aplica

Análise de poder a priori é obrigatória em desenho de pesquisa séria: planejamento de tamanho amostral, propostas de financiamento, pré-registro de estudos. Em contextos com pré-registro (OSF, AsPredicted, ClinicalTrials.gov), análise de poder é exigida explicitamente. É essencial em ensaios clínicos, onde sub-amostragem é eticamente questionável (expor participantes a procedimentos sem chance real de detectar efeito) e super-amostragem é desperdiçadora. Software como G*Power, pwr (R), e statsmodels (Python) oferecem implementações para os cenários mais comuns. Em meta-análise, poder agregado de múltiplos estudos pequenos pode justificar combinação onde estudos individuais ficaram sub-poderados.

Quando NÃO se aplica

Análise post hoc de poder (a partir do efeito observado, não do esperado) tem valor questionável e é desencorajada por estatísticos contemporâneos — Hoenig e Heisey (2001) mostraram que ela apenas redunda o $p$ -valor. Em desenhos exploratórios sem hipótese específica pré-formulada, análise de poder não tem sentido — o objeto é descobrir efeitos, não confirmá-los. Em desenhos bayesianos, conceitos análogos (poder bayesiano, previsão de fator de Bayes) substituem o poder frequentista clássico. Em problemas de big data, poder torna-se irrelevante porque qualquer efeito não-nulo eventualmente atinge significância — discussão deve mudar para tamanho de efeito e relevância prática.

Aplicações por área

— Ensaios clínicos: análise de poder é exigência regulatória (FDA, EMA, ANVISA); cálculo de $n$ baseado em efeito clinicamente relevante mínimo. — Psicologia experimental: crise de replicação documentou prevalência de estudos sub-poderados; APA hoje exige análise a priori. — Neurociência: Button et al. (2013) documentaram poder médio de 8-31% em estudos da área; conclusão: ampla parte da literatura é não-replicável. — Pesquisa em educação: intervenções pedagógicas exigem amostra grande para detectar efeitos pequenos a moderados típicos do campo.

Armadilhas comuns

A primeira armadilha é confiar em “regras de bolso” para tamanho amostral em vez de cálculo formal — $n = 30$ ou $n = 100$ não substitui análise. A segunda é fazer análise a priori com efeito esperado otimista demais (tirado de literatura inflada por viés de publicação) — produz amostra inadequada quando o efeito real é mais modesto. A terceira é executar análise post hoc e interpretar como “estudo teve baixo poder, daí não rejeitei $H_0$ ” — erro lógico documentado. A quarta é ignorar variância e desenho: poder em ANOVA fatorial, em modelos hierárquicos, em sobrevivência exige cálculos específicos, não fórmula simples. A quinta é confundir poder com replicabilidade: estudo bem-poderado tem maior chance de produzir resultado replicável, mas poder alto não garante replicabilidade — pode haver vieses sistemáticos não capturados pela análise.