Definição estendida
Poder estatístico é a probabilidade de um teste estatístico rejeitar corretamente a hipótese nula quando ela é, de fato, falsa. Em notação, Poder = , onde é a probabilidade de erro tipo II (falso negativo: aceitar falsa). O conceito foi formalizado no framework de Neyman-Pearson nos anos 1930 e operacionalizado para ciências comportamentais por Jacob Cohen no manual canônico Statistical Power Analysis for the Behavioral Sciences (1988), que estabeleceu a convenção de como padrão mínimo aceitável. Poder depende de quatro fatores interrelacionados: tamanho de efeito esperado, tamanho amostral, nível de significância (tipicamente 0,05), e variância dos dados. Análise a priori calcula o necessário para detectar um efeito esperado com poder mínimo desejado. Análise post hoc (calcular poder a partir do efeito observado) é matematicamente possível mas amplamente criticada — não fornece informação adicional além do -valor.
Quando se aplica
Análise de poder a priori é obrigatória em desenho de pesquisa séria: planejamento de tamanho amostral, propostas de financiamento, pré-registro de estudos. Em contextos com pré-registro (OSF, AsPredicted, ClinicalTrials.gov), análise de poder é exigida explicitamente. É essencial em ensaios clínicos, onde sub-amostragem é eticamente questionável (expor participantes a procedimentos sem chance real de detectar efeito) e super-amostragem é desperdiçadora. Software como G*Power, pwr (R), e statsmodels (Python) oferecem implementações para os cenários mais comuns. Em meta-análise, poder agregado de múltiplos estudos pequenos pode justificar combinação onde estudos individuais ficaram sub-poderados.
Quando NÃO se aplica
Análise post hoc de poder (a partir do efeito observado, não do esperado) tem valor questionável e é desencorajada por estatísticos contemporâneos — Hoenig e Heisey (2001) mostraram que ela apenas redunda o -valor. Em desenhos exploratórios sem hipótese específica pré-formulada, análise de poder não tem sentido — o objeto é descobrir efeitos, não confirmá-los. Em desenhos bayesianos, conceitos análogos (poder bayesiano, previsão de fator de Bayes) substituem o poder frequentista clássico. Em problemas de big data, poder torna-se irrelevante porque qualquer efeito não-nulo eventualmente atinge significância — discussão deve mudar para tamanho de efeito e relevância prática.
Aplicações por área
— Ensaios clínicos: análise de poder é exigência regulatória (FDA, EMA, ANVISA); cálculo de baseado em efeito clinicamente relevante mínimo. — Psicologia experimental: crise de replicação documentou prevalência de estudos sub-poderados; APA hoje exige análise a priori. — Neurociência: Button et al. (2013) documentaram poder médio de 8-31% em estudos da área; conclusão: ampla parte da literatura é não-replicável. — Pesquisa em educação: intervenções pedagógicas exigem amostra grande para detectar efeitos pequenos a moderados típicos do campo.
Armadilhas comuns
A primeira armadilha é confiar em “regras de bolso” para tamanho amostral em vez de cálculo formal — ou não substitui análise. A segunda é fazer análise a priori com efeito esperado otimista demais (tirado de literatura inflada por viés de publicação) — produz amostra inadequada quando o efeito real é mais modesto. A terceira é executar análise post hoc e interpretar como “estudo teve baixo poder, daí não rejeitei ” — erro lógico documentado. A quarta é ignorar variância e desenho: poder em ANOVA fatorial, em modelos hierárquicos, em sobrevivência exige cálculos específicos, não fórmula simples. A quinta é confundir poder com replicabilidade: estudo bem-poderado tem maior chance de produzir resultado replicável, mas poder alto não garante replicabilidade — pode haver vieses sistemáticos não capturados pela análise.