Projeto Aplicado • NLP • Setor Financeiro

NLP Triagem Inteligente Financeira

Projeto de Processamento de Linguagem Natural aplicado ao domínio financeiro, com foco na classificação multiclasses de perguntas e demandas textuais para apoiar triagem inteligente, priorização e encaminhamento operacional.

Visão Geral do Projeto

Este projeto foi desenvolvido como um case de portfólio para demonstrar um fluxo completo de NLP aplicado ao negócio, desde o entendimento de domínio até readiness para deployment inicial. A solução foi estruturada para classificar perguntas financeiras em categorias, comparar abordagens clássicas e avançadas e apoiar uma decisão técnica orientada por evidência.

Além da modelagem, o projeto também buscou demonstrar estruturação metodológica, capacidade de comparação entre abordagens e preparação para um deployment inicial com logging e monitoramento básico.

Ficha Técnica

Domínio: Atendimento e triagem no setor financeiro

Tipo: Projeto de Portfólio

Abordagem: NLP Multiclasses / Classificação Textual

Foco: Enriquecimento de sinais geométricos

Metodologia: CRISP-DM+ Lean com Ontologia e BLM

Deployment inicial: Baseline com API readiness

Idioma: Português

Python Pandas Scikit-learn Transformers NKP Machine Learning

Problema de Negócio

Instituições financeiras recebem continuamente dúvidas, solicitações e manifestações textuais vindas de canais como app, web, chat e atendimento humano. Quando essa triagem depende fortemente de análise manual, surgem inconsistências de classificação, aumento de esforço operacional e dificuldade de roteamento.

Objetivo do Projeto

Construir uma solução de NLP capaz de receber uma pergunta financeira em linguagem natural e prever sua categoria, apoiando cenários de triagem, priorização e encaminhamento.

Abordagem Aplicada

  • Entendimento de domínio com Ontologia mínima e BLM na Etapa 0.
  • Preparação de dados em camadas bronze, silver e gold.
  • Treino de baseline supervisionado com TF-IDF + Logistic Regression.
  • Experimento comparativo com transformer para avaliar ganho contextual.
  • Avaliação quantitativa e qualitativa dos erros.
  • Decisão técnica baseada em evidência para escolha do modelo de deployment inicial.
  • Preparação da camada de inferência, logging e monitoramento básico.

Destaques do Projeto

Baseline Forte

O baseline com TF-IDF + Logistic Regression apresentou o melhor desempenho observado e se mostrou a alternativa mais robusta para a primeira entrega.

Comparação Honesta

O projeto comparou baseline e transformer de forma explícita, documentando resultados, limitações e implicações técnicas sem maquiar o experimento.

Deployment Readiness

A solução foi preparada para inferência, logging de predições, monitoramento inicial e futura integração com API REST baseada em FastAPI.

Por que este projeto é relevante no portfólio

  • Mostra aplicação de NLP em um contexto financeiro realista e em português.
  • Demonstra método ao longo de todo o pipeline, do problema ao deployment readiness.
  • Mostra maturidade analítica ao comparar abordagens e sustentar decisão baseada em evidência.
  • Reforça competências em Machine Learning, organização de projeto, documentação e serving inicial.
  • Ajuda a construir uma narrativa de portfólio mais completa, conectando técnica, negócio e produto.

Próximos Passos

  • Implementar a API executável com FastAPI e endpoints de inferência.
  • Adicionar healthcheck, model-info e camada mais robusta de logging.
  • Construir dashboard simples de monitoramento operacional.
  • Executar nova rodada do transformer com target reagrupado e taxonomia mais viável.
  • Evoluir a solução para cenários complementares, como recuperação assistida de resposta.

Explorar o projeto completo

Esta página apresenta a visão executiva do case. Para ver a construção técnica detalhada, a documentação analítica e a evolução do estudo, acesse o notebook HTML completo e o repositório do projeto.