Análise de sentimento — Glossário Aria Research

Definição estendida

Análise de sentimento (sentiment analysis, também chamada opinion mining) é a subárea de NLP que classifica polaridade afetiva em texto — tipicamente positivo, negativo, neutro — ou identifica emoções específicas (alegria, raiva, medo, surpresa, tristeza, nojo, baseado em modelos como Ekman ou Plutchik). Pang e Lee (2008, Foundations and Trends in Information Retrieval) e Liu (2012, Synthesis Lectures) ofereceram as referências consolidadoras da área. Abordagens evoluíram em três gerações: (1) léxicos manuais com listas de palavras valoradas (LIWC, SentiWordNet, VADER) — frágeis a contexto e negação; (2) classificadores supervisionados clássicos (Naive Bayes, SVM com TF-IDF e n-gramas) sobre datasets rotulados — baseline sólido por anos; (3) modelos baseados em transformers (BERT fine-tuned, RoBERTa, modelos multilíngues como XLM-R) — estado da arte em sentimento contextual e aspect-based sentiment analysis (ABSA), em que se detecta sentimento sobre atributos específicos do objeto (e.g., qualidade da bateria de produto vs. qualidade da câmera).

Quando se aplica

Análise de sentimento aplica-se em monitoramento de marca (redes sociais, reviews), pesquisa de mercado, análise de comunicação política, estudos de mídia, customer experience analytics, análise de chamadas de atendimento. Em pesquisa acadêmica, aplica-se em estudos sobre opinião pública, análise de discursos institucionais, polarização política em mídia, e em humanidades digitais para análise emocional de textos literários ou históricos. Aplica-se em filtragem inicial de texto em pipelines maiores: priorizar mensagens negativas em suporte ao cliente, detectar discurso de ódio em moderação. ABSA é particularmente útil em análise de reviews de produtos onde múltiplos aspectos coexistem.

Quando NÃO se aplica

Não se aplica como substituto de análise de conteúdo qualitativa profunda em pesquisa sobre experiência subjetiva — sentimento codifica polaridade simplificada que perde nuances importantes (ironia, sarcasmo, ambivalência, humor). Não se aplica em texto curto sem contexto suficiente: sarcasmo é desafio crônico, especialmente fora de domínio de treinamento. Não se aplica diretamente a línguas com baixa cobertura em modelos pré-treinados sem adaptação cuidadosa: viés de inglês permanece. Não substitui validação humana em decisões de alto impacto: erro em moderação automática de discurso de ódio tem custo social real. Em textos clínicos ou jurídicos, sentimento genérico raramente é informativo — domínio exige modelos específicos.

Aplicações por área

— Marketing e CX: monitoramento de reviews em e-commerce, redes sociais; ABSA para extrair feedback granular sobre atributos. — Comunicação política: análise de polarização em discursos e mídia; estudos de campanha eleitoral. — Saúde mental e digital phenotyping: detecção de marcadores afetivos em texto de pacientes (com cuidado ético). — Humanidades digitais: análise emocional de textos históricos, literários; mapeamento de mudança afetiva em corpora longitudinais.

Armadilhas comuns

A primeira armadilha é tratar sentimento positivo/negativo como dimensão única e suficiente: textos podem ter ambivalência simultânea (positivo sobre A, negativo sobre B no mesmo enunciado); ABSA é necessário para granularidade. A segunda é não testar performance em domínio de aplicação: modelo treinado em reviews da Amazon performa pior em tweets políticos; transferência exige fine-tuning ou validação. A terceira é confiar cegamente em ferramentas off-the-shelf (VADER, TextBlob) em domínios técnicos: vocabulário especializado quebra léxicos manuais e exige adaptação. A quarta é ignorar sarcasmo e ironia: detecção destes ainda é problema aberto e mesmo modelos pré-treinados grandes erram com frequência. A quinta é não documentar limitações de viés representacional: modelos refletem vieses dos dados de treino, frequentemente sub-representando dialetos, gírias regionais e outras línguas.