Como navegar por esta trilha
Em vez de abrir diretamente um único notebook, esta página apresenta a lógica do projeto de forma estruturada. Cada bloco representa uma fase da solução e mostra o papel técnico daquela etapa dentro da construção do case.
Notebooks publicados
Fluxo completo do entendimento do problema até a conclusão executiva.
Estratégias de modelagem
Baseline clássico com TF-IDF + LogReg e experimento com transformer.
Visão CRISP-DM+
Ampliação do framework com camada semântica e leitura executiva de portfólio.
Evolução do case ao longo das fases
Cada etapa abaixo representa um avanço concreto da solução. A ideia é mostrar maturidade metodológica, raciocínio de negócio e capacidade de transformar análise em produto de portfólio.
Camada semântica do problema
Antes da exploração tradicional dos dados, o projeto se apoia em uma etapa ampliada do CRISP-DM: Ontologia, Business Language Model e Clustering Semântico. Essa fase ajuda a estruturar o vocabulário do domínio financeiro, reduzir ambiguidades conceituais e alinhar a linguagem do negócio com a linguagem do modelo.
Business Understanding
Aqui o problema é traduzido em objetivo analítico. O foco é entender por que a triagem inteligente de perguntas financeiras gera valor operacional, quais são os critérios de sucesso e como o projeto será avaliado do ponto de vista técnico e de negócio.
Data Understanding
Nesta fase o dataset é inspecionado em profundidade: estrutura, colunas, distribuição de classes, volume, sinais de desbalanceamento e características textuais. O objetivo é entender se os dados sustentam bem a tarefa de classificação multiclasses.
Data Preparation
Depois de compreender a base, o projeto entra na preparação: limpeza textual, normalização, padronização, revisão de rótulos e organização do dataset para a primeira versão dos modelos. Aqui nasce a base utilizável para a modelagem supervisionada.
Modeling • Baseline clássico
O baseline com TF-IDF + Logistic Regression oferece um ponto de partida sólido, interpretável e eficiente. Ele mostra como um pipeline tradicional de NLP pode entregar valor real e servir como referência para comparações futuras.
Modeling • Abordagem avançada com Transformer
A etapa seguinte amplia o projeto com uma arquitetura baseada em transformer. O objetivo aqui não é apenas buscar desempenho, mas também demonstrar maturidade técnica, comparação metodológica e visão de evolução do pipeline de NLP.
Evaluation & Business Interpretation
Aqui os resultados são avaliados sob duas perspectivas: a técnica, com métricas e comparação entre modelos, e a de negócio, com interpretação prática do que a solução representa em triagem, priorização e ganho operacional.
Deployment & Monitoring
O projeto avança do experimento para uma visão de produto. Nesta fase entram a API baseline, o fluxo de inferência e os primeiros elementos de monitoramento, mostrando preocupação com uso real, operação e sustentação da solução.
Executive Conclusion & Portfolio Packaging
A jornada termina com síntese executiva, recomendações, narrativa final do case e empacotamento profissional para portfólio. É a fase em que o projeto deixa de ser apenas técnico e passa a ser também uma peça de posicionamento profissional.
Sugestão de navegação
Para uma experiência mais forte de portfólio, o ideal é seguir os notebooks em ordem. Isso ajuda o recrutador ou gestor a perceber método, progressão e clareza de raciocínio.