TRANSVERSAL

Princípios FAIR

Conjunto de quatro princípios para gestão de dados de pesquisa: Findable, Accessible, Interoperable, Reusable. Articulados por Wilkinson et al. (2016, Scientific Data). Padrão internacional adotado por European Commission, NIH e funders globais.

Definição estendida

Os princípios FAIR são um conjunto de quatro princípios para gestão de dados de pesquisa, articulados por Wilkinson et al. (2016, Scientific Data): Findable (encontrável — metadados ricos, identificadores persistentes como DOI, indexados em catálogos), Accessible (acessível — protocolos abertos e padronizados de recuperação, mesmo quando dados em si têm acesso restrito por motivos legítimos), Interoperable (interoperável — vocabulários, formatos e schemas padronizados que permitem combinação com outros datasets), Reusable (reutilizável — licenças claras, documentação rica, proveniência e contexto suficientes para reuso por terceiros). FAIR não exige que dados sejam abertos — distinção crítica frequentemente perdida. Dados sensíveis (saúde, indústria) podem ser FAIR sem serem públicos: metadados são abertos e descobríveis; dados em si têm acesso mediado. European Commission adotou FAIR como princípio operacional do European Open Science Cloud (EOSC) em 2018; NIH adotou em 2023 (Data Management and Sharing Policy); CNPq e FAPESP têm orientações alinhadas.

Quando se aplica

FAIR aplica-se em qualquer projeto que produz dados como output substantivo: pesquisa quantitativa, qualitativa, observacional, experimental, computacional. É exigência crescente em propostas de financiamento — Data Management Plan (DMP) é entregável padrão em projetos ERC, NIH, NSF, e cada vez mais em FAPESP/CAPES. Aplica-se especialmente em projetos colaborativos internacionais onde reuso por outros grupos é objetivo explícito. Aplica-se em datasets que sustentam manuscritos publicados — periódicos top-tier exigem deposição em repositórios FAIR-compliant (Zenodo, Dryad, Figshare, repositórios disciplinares específicos). FAIR é também elemento de reprodutibilidade: dados FAIR são pré-condição para reprodução computacional por terceiros.

Quando NÃO se aplica

FAIR não substitui consentimento informado — mesmo dados anonimizáveis, se coletados com consentimento limitado, têm restrições de uso que precisam ser respeitadas. Não substitui análise de risco LGPD/GDPR/HIPAA — alguns dados, ainda que tecnicamente FAIR-compliant, exigem proteção que limita acessibilidade. Não se aplica diretamente em dados industriais sob contrato de propriedade intelectual restritiva sem renegociação. Em pesquisa com povos indígenas, princípios CARE (Collective benefit, Authority to control, Responsibility, Ethics) complementam FAIR — em alguns casos, ditam abordagens de soberania de dados que limitam escopo do “Findable” e “Accessible”.

Aplicações por área

Saúde e biomédicas: repositórios Open Targets, ENA, dbGaP; FAIR é estrutural em consórcios genômicos. — Ciências ambientais: PANGAEA, GBIF — dados climáticos e biodiversidade exemplares de FAIR aplicado. — Ciências sociais: ICPSR, DataverseNL — repositórios FAIR para dados de surveys e experimentos. — Humanidades digitais: transcrições, corpora textuais e edições digitais em repositórios CLARIN, DARIAH.

Armadilhas comuns

A primeira armadilha é confundir FAIR com Open Data — FAIR é compatível com acesso restrito desde que metadados sejam abertos e protocolo de acesso seja padronizado. A segunda é tratar FAIR como checklist administrativa — implementação real exige decisões técnicas (esquema de metadados, vocabulários controlados, identificadores persistentes) que requerem expertise. A terceira é depositar dataset em repositório aleatório com baixa indexação e considerar “Findable” cumprido — repositório precisa ter alcance e infraestrutura de descoberta (catálogos federados, integração com Google Dataset Search). A quarta é negligenciar metadados ricos: dataset com metadados pobres é tecnicamente FAIR mas praticamente irreusável. A quinta é confundir Reusable com qualidade dos dados — FAIR endereça gestão e disponibilização, não cuidado experimental nem rigor metodológico; dataset FAIR pode ainda ser de baixa qualidade científica.

Última atualização —