Intervalo de confiança — Glossário Aria Research

Definição estendida

Intervalo de confiança (IC) é uma faixa de valores construída a partir de dados amostrais que, em uso repetido sob a mesma metodologia, contém o parâmetro populacional verdadeiro com probabilidade igual ao nível de confiança nominal — tipicamente 95%. A formalização canônica é Neyman (1937), em ruptura com a tradição fisheriana puramente baseada em $p$ -valor. Para a média populacional com variância conhecida, a forma clássica é:

\text{IC}_{1-\alpha} = \bar{x} \pm z_{1-\alpha/2} \cdot \frac{s}{\sqrt{n}}

onde $\bar{x}$ é a média amostral, $s$ o desvio padrão amostral, $n$ o tamanho amostral, e $z_{1-\alpha/2}$ o valor crítico da normal padrão (1,96 para 95%). Para amostra pequena ou variância desconhecida, $z$ é substituído por $t$ de Student. A interpretação correta é probabilística sobre o procedimento, não sobre o intervalo específico calculado: em 95% de aplicações repetidas do método, o intervalo capturará o parâmetro. Hoekstra et al. (2014) documentaram, em estudo com mais de 1.000 pesquisadores e estudantes, que a maioria interpreta IC incorretamente como “probabilidade de o parâmetro estar no intervalo” — falácia formalmente equivalente à interpretação errada do $p$ -valor.

Quando se aplica

Intervalo de confiança é exigido em reporting moderno de qualquer estimativa pontual: média, proporção, diferença entre grupos, razão de chances, coeficiente de regressão, tamanho de efeito. APA, AMA, ICMJE e CONSORT exigem IC em comunicação de resultados. É especialmente útil para comunicar precisão estatística — IC estreito sinaliza estimativa precisa, IC largo sinaliza incerteza. Em meta-análise, IC é a métrica primária para avaliar consistência entre estudos. Em decisão clínica, IC orienta julgamento sobre relevância prática: efeito cuja IC inclui zero (ou valor neutro como 1 para razão) sinaliza que efeito real pode ser nulo.

Quando NÃO se aplica

Não se aplica como substituto de tamanho de efeito ou $p$ -valor — os três se complementam. Não substitui análise bayesiana quando contexto exige interpretação direta da probabilidade do parâmetro (intervalo de credibilidade bayesiano é o objeto análogo). Em amostras muito pequenas ( $n < 30$ ) com distribuição não-normal, IC clássico baseado em normalidade é não-confiável; bootstrap ou métodos não-paramétricos são alternativas. Para parâmetros não-padrão (mediana, quantis, parâmetros de modelo complexo), IC analítico pode não existir e métodos numéricos são necessários.

Aplicações por área

— Saúde e biomédicas: padrão obrigatório em ensaios clínicos (CONSORT exige); razão de chances com IC é estrutura básica de epidemiologia. — Ciências sociais aplicadas: complementa $p$ -valor em reporting moderno; APA exige. — Economia e finanças: IC para coeficientes de regressão, previsões de séries temporais, parâmetros estruturais. — Engenharias: IC para parâmetros de processo, calibração de instrumentos, controle estatístico de qualidade.

Armadilhas comuns

A primeira armadilha é interpretar IC como “probabilidade de o parâmetro estar no intervalo” — falácia documentada por Hoekstra et al. (2014); a probabilidade refere-se ao procedimento de longo prazo, não a um intervalo específico já calculado. A segunda é confiar em IC clássico em pressupostos violados — assimetria, heterocedasticidade ou amostra pequena exigem alternativas robustas (bootstrap percentílico ou BCa). A terceira é equivaler IC com teste de hipótese: IC que inclui valor nulo (zero, 1) é evidência mais rica que apenas $p > 0,05$ — informa não só sobre rejeição mas também sobre magnitude plausível. A quarta é assumir IC simétrico: para razão de chances ou risco relativo, IC é simétrico em escala logarítmica, não na escala original. A quinta é confiar em IC sem reportar tamanho amostral e desvio: $n$ pequeno produz IC artificialmente estreito quando variância é mal estimada.