Reprodutibilidade e replicabilidade — Glossário Aria Research

Definição estendida

Reprodutibilidade e replicabilidade são conceitos relacionados mas distintos, frequentemente confundidos. Reprodutibilidade (em alguns campos chamada reprodutibilidade computacional) é a capacidade de obter os mesmos resultados de um estudo a partir dos mesmos dados e mesmo código — ou seja, terceiro pesquisador, com material original, deve chegar aos números reportados. Replicabilidade é a capacidade de obter resultados consistentes em estudo independente, com nova coleta de dados sob procedimento similar — ou seja, hipótese mantém-se quando testada em amostra nova. A distinção foi formalizada por Goodman, Fanelli e Ioannidis (2016, Science Translational Medicine) e adotada pela National Academies of Sciences (2019, EUA) como padrão. A “crise de replicação” — documentada de forma seminal pelo Open Science Collaboration (2015, Science), que conseguiu replicar apenas 36% de 100 estudos psicológicos publicados em revistas top-tier — motivou a expansão de práticas de Open Science: pré-registro, dados abertos, código aberto, registered reports.

Quando se aplica

Os dois conceitos aplicam-se a qualquer projeto de pesquisa empírica, com pesos diferentes por campo. Reprodutibilidade computacional é exigência mínima em pesquisa quantitativa: dados e código devem permitir que outro pesquisador chegue aos mesmos resultados. Periódicos top-tier hoje exigem disponibilização de dados e código (Nature, Science, PNAS, eLife têm políticas explícitas; PLOS é mais antigo nessa exigência). Replicabilidade aplica-se em planejamento de estudos confirmatórios — pré-registro, design statistical analysis plan (SAP), e poder estatístico adequado são instrumentos. Em ML aplicado, reprodutibilidade computacional inclui controle de seeds aleatórias, versão de bibliotecas, hardware quando relevante.

Quando NÃO se aplica

Replicabilidade direta não se aplica em pesquisa qualitativa pura no sentido estrito — coleta etnográfica em contexto único não é replicável por construção; transferibilidade é o conceito análogo. Em estudos de eventos históricos, naturais ou clínicos raros, replicação literal é impossível. Reprodutibilidade computacional não se aplica em pesquisa que usa dados confidenciais que não podem ser publicamente compartilhados (dados clínicos identificáveis, dados industriais sob NDA) — alternativas: dados sintéticos, repositório com acesso restrito mediado, ou descrição metodológica detalhada que permita outro pesquisador replicar com dados próprios.

Aplicações por área

— Saúde e biomédicas: crise de reprodutibilidade em pré-clínica documentada (Begley & Ellis, 2012); ARRIVE e CONSORT respondem. — Psicologia: Open Science Collaboration (2015) é referência seminal; many labs projects e reformas em revistas Q1. — Ciências da computação e ML: ML Reproducibility Challenge anual; políticas em NeurIPS, ICML, ACL exigem código. — Ciências sociais empíricas: AEA Data Editor; pré-registro em economia experimental crescendo desde 2018.

Armadilhas comuns

A primeira armadilha é usar “reprodutibilidade” e “replicabilidade” como sinônimos — em discurso técnico moderno, distinção importa: estudo pode ser reprodutível (dados e código permitem refazer cálculos) mas não-replicável (resultado não se sustenta em nova amostra). A segunda é confundir reprodutibilidade com transparência — disponibilizar dados não garante reprodução: código incompleto, dependências não-documentadas, hardware específico podem bloquear. A terceira é tratar falha de replicação como prova de fraude — falhas podem refletir variabilidade legítima entre populações, contextos, ou simplesmente regressão à média de efeitos inflados por p-hacking inocente. A quarta é confiar em “p < 0,05” do estudo original como garantia: meta-ciência sugere que efeito estimado em estudo único superestima magnitude verdadeira por vieses estruturais (publication bias, garden of forking paths). A quinta é não distinguir replicação direta (mesma metodologia) de replicação conceitual (mesmo construto, método diferente) — ambas relevantes mas comunicam coisas diferentes.