DADOS E ESTATÍSTICA

Intervalo de confiança

Faixa de valores construída a partir de dados amostrais que, em uso repetido, contém o parâmetro populacional verdadeiro com probabilidade igual ao nível de confiança nominal (tipicamente 95%). Formalizado por Neyman em 1937.

Definição estendida

Intervalo de confiança (IC) é uma faixa de valores construída a partir de dados amostrais que, em uso repetido sob a mesma metodologia, contém o parâmetro populacional verdadeiro com probabilidade igual ao nível de confiança nominal — tipicamente 95%. A formalização canônica é Neyman (1937), em ruptura com a tradição fisheriana puramente baseada em pp-valor. Para a média populacional com variância conhecida, a forma clássica é:

IC1α=xˉ±z1α/2sn\text{IC}_{1-\alpha} = \bar{x} \pm z_{1-\alpha/2} \cdot \frac{s}{\sqrt{n}}

onde xˉ\bar{x} é a média amostral, ss o desvio padrão amostral, nn o tamanho amostral, e z1α/2z_{1-\alpha/2} o valor crítico da normal padrão (1,96 para 95%). Para amostra pequena ou variância desconhecida, zz é substituído por tt de Student. A interpretação correta é probabilística sobre o procedimento, não sobre o intervalo específico calculado: em 95% de aplicações repetidas do método, o intervalo capturará o parâmetro. Hoekstra et al. (2014) documentaram, em estudo com mais de 1.000 pesquisadores e estudantes, que a maioria interpreta IC incorretamente como “probabilidade de o parâmetro estar no intervalo” — falácia formalmente equivalente à interpretação errada do pp-valor.

Quando se aplica

Intervalo de confiança é exigido em reporting moderno de qualquer estimativa pontual: média, proporção, diferença entre grupos, razão de chances, coeficiente de regressão, tamanho de efeito. APA, AMA, ICMJE e CONSORT exigem IC em comunicação de resultados. É especialmente útil para comunicar precisão estatística — IC estreito sinaliza estimativa precisa, IC largo sinaliza incerteza. Em meta-análise, IC é a métrica primária para avaliar consistência entre estudos. Em decisão clínica, IC orienta julgamento sobre relevância prática: efeito cuja IC inclui zero (ou valor neutro como 1 para razão) sinaliza que efeito real pode ser nulo.

Quando NÃO se aplica

Não se aplica como substituto de tamanho de efeito ou pp-valor — os três se complementam. Não substitui análise bayesiana quando contexto exige interpretação direta da probabilidade do parâmetro (intervalo de credibilidade bayesiano é o objeto análogo). Em amostras muito pequenas (n<30n < 30) com distribuição não-normal, IC clássico baseado em normalidade é não-confiável; bootstrap ou métodos não-paramétricos são alternativas. Para parâmetros não-padrão (mediana, quantis, parâmetros de modelo complexo), IC analítico pode não existir e métodos numéricos são necessários.

Aplicações por área

Saúde e biomédicas: padrão obrigatório em ensaios clínicos (CONSORT exige); razão de chances com IC é estrutura básica de epidemiologia. — Ciências sociais aplicadas: complementa pp-valor em reporting moderno; APA exige. — Economia e finanças: IC para coeficientes de regressão, previsões de séries temporais, parâmetros estruturais. — Engenharias: IC para parâmetros de processo, calibração de instrumentos, controle estatístico de qualidade.

Armadilhas comuns

A primeira armadilha é interpretar IC como “probabilidade de o parâmetro estar no intervalo” — falácia documentada por Hoekstra et al. (2014); a probabilidade refere-se ao procedimento de longo prazo, não a um intervalo específico já calculado. A segunda é confiar em IC clássico em pressupostos violados — assimetria, heterocedasticidade ou amostra pequena exigem alternativas robustas (bootstrap percentílico ou BCa). A terceira é equivaler IC com teste de hipótese: IC que inclui valor nulo (zero, 1) é evidência mais rica que apenas p>0,05p > 0,05 — informa não só sobre rejeição mas também sobre magnitude plausível. A quarta é assumir IC simétrico: para razão de chances ou risco relativo, IC é simétrico em escala logarítmica, não na escala original. A quinta é confiar em IC sem reportar tamanho amostral e desvio: nn pequeno produz IC artificialmente estreito quando variância é mal estimada.

Última atualização —