NLP Triagem Inteligente Financeira

Visão Geral do Projeto

Este projeto foi desenvolvido como um case de portfólio para demonstrar um fluxo completo de NLP aplicado ao negócio, desde o entendimento de domínio até readiness para deployment inicial. A solução foi estruturada para classificar perguntas financeiras em categorias, comparar abordagens clássicas e avançadas e apoiar uma decisão técnica orientada por evidência.

Além da modelagem, o projeto também buscou demonstrar estruturação metodológica, capacidade de comparação entre abordagens e preparação para um deployment inicial com logging e monitoramento básico.

Ficha Técnica

Domínio: Atendimento e triagem no setor financeiro

Tipo: Projeto de Portfólio

Abordagem: NLP Multiclasses / Classificação Textual

Foco: Enriquecimento de sinais geométricos

Metodologia: CRISP-DM+ Lean com Ontologia e BLM

Deployment inicial: Baseline com API readiness

Idioma: Português

Python Pandas Scikit-learn Transformers NKP Machine Learning

Problema de Negócio

Instituições financeiras recebem continuamente dúvidas, solicitações e manifestações textuais vindas de canais como app, web, chat e atendimento humano. Quando essa triagem depende fortemente de análise manual, surgem inconsistências de classificação, aumento de esforço operacional e dificuldade de roteamento.

Objetivo do Projeto

Construir uma solução de NLP capaz de receber uma pergunta financeira em linguagem natural e prever sua categoria, apoiando cenários de triagem, priorização e encaminhamento.

Abordagem Aplicada

Entendimento de domínio com Ontologia mínima e BLM na Etapa 0.
Preparação de dados em camadas bronze, silver e gold.
Treino de baseline supervisionado com TF-IDF + Logistic Regression.

Experimento comparativo com transformer para avaliar ganho contextual.
Avaliação quantitativa e qualitativa dos erros.
Decisão técnica baseada em evidência para escolha do modelo de deployment inicial.
Preparação da camada de inferência, logging e monitoramento básico.

Destaques do Projeto

Baseline Forte

O baseline com TF-IDF + Logistic Regression apresentou o melhor desempenho observado e se mostrou a alternativa mais robusta para a primeira entrega.

Comparação Honesta

O projeto comparou baseline e transformer de forma explícita, documentando resultados, limitações e implicações técnicas sem maquiar o experimento.

Deployment Readiness

A solução foi preparada para inferência, logging de predições, monitoramento inicial e futura integração com API REST baseada em FastAPI.

Por que este projeto é relevante no portfólio

Mostra aplicação de NLP em um contexto financeiro realista e em português.
Demonstra método ao longo de todo o pipeline, do problema ao deployment readiness.
Mostra maturidade analítica ao comparar abordagens e sustentar decisão baseada em evidência.

Reforça competências em Machine Learning, organização de projeto, documentação e serving inicial.
Ajuda a construir uma narrativa de portfólio mais completa, conectando técnica, negócio e produto.

Próximos Passos

Implementar a API executável com FastAPI e endpoints de inferência.
Adicionar healthcheck, model-info e camada mais robusta de logging.
Construir dashboard simples de monitoramento operacional.
Executar nova rodada do transformer com target reagrupado e taxonomia mais viável.
Evoluir a solução para cenários complementares, como recuperação assistida de resposta.

Explorar o projeto completo

Esta página apresenta a visão executiva do case. Para ver a construção técnica detalhada, a documentação analítica e a evolução do estudo, acesse o notebook HTML completo e o repositório do projeto.

Abrir Notebook HTML Voltar para Projetos