Problema de negócio
Fraudes transacionais raramente aparecem apenas como eventos isolados. O risco geralmente emerge de relações indiretas entre contas, dispositivos, beneficiários, IPs e padrões de movimentação.
Hipótese central do projeto
Uma abordagem antifraude fica mais forte quando combina sinais transacionais explicáveis com contexto relacional de grafo.
Regras explicáveis
Capturam sinais claros como alto valor, rajadas, conta nova e dispositivo compartilhado.
Graph Analytics
Revela conexões indiretas, comunidades suspeitas e entidades estruturalmente relevantes.
Base simulada para análise, regras e grafo.
Dispositivo compartilhado, beneficiário concentrador, rajada e outros.
Catálogo de regras com severidade, pontuação e racional.
Combina regras, risco de entidade e risco de comunidade.
Arquitetura analítica
O MVP foi organizado como uma jornada de dados completa: entendimento de domínio, geração de dados sintéticos, EDA, regras, grafo, algoritmos estruturais, score final e empacotamento executivo.
Pipeline conceitual
Synthetic Data
↓
EDA Transacional
↓
Rules Engine Antifraud
↓
Knowledge Graph Modeling
↓
Graph Algorithms
↓
Fraud Risk Score
↓
Explainability & Portfolio
| Camada | Descrição | Saída |
|---|---|---|
| CRISP-DM+ | Ontologia, BLM, taxonomia e hipóteses investigativas. | Base conceitual |
| Synthetic Data | Clientes, contas, transações, dispositivos, IPs e beneficiários. | Parquets recriáveis |
| Rules Engine | Regras nomeadas com severidade, pontos e explicação. | Rule Score |
| Knowledge Graph | Modelagem de nós e relações compatíveis com Neo4j. | Cypher + CSVs |
| Graph Algorithms | Centralidade, comunidades, PageRank e Betweenness. | Graph Risk |
| Explainability | Explicação textual por transação priorizada. | Final Alert |
CRISP-DM+ como diferencial
O projeto começa com uma etapa zero de entendimento semântico do domínio, conectando negócio e modelagem antes da parte técnica.
Cenários simulados
A base sintética foi desenhada para simular padrões típicos de investigação antifraude, sem uso de dados reais ou sensíveis.
Knowledge Graph e Graph Analytics
O grafo conecta contas, transações, dispositivos, IPs, beneficiários, cartões e regras antifraude, permitindo investigar relações indiretas difíceis de observar em tabelas tradicionais.
Modelo conceitual
(:Cliente)-[:POSSUI]->(:Conta)
(:Conta)-[:REALIZOU]->(:Transacao)
(:Transacao)-[:ENVIOU_PARA]->(:Beneficiario)
(:Transacao)-[:USOU]->(:Dispositivo)
(:Transacao)-[:ORIGINOU_DE]->(:IP)
(:Transacao)-[:UTILIZOU]->(:Cartao)
(:Transacao)-[:ACIONOU]->(:Regra)
Algoritmos aplicados
Entidades muito conectadas.
Relevância estrutural.
Grupos suspeitos.
Possíveis contas ponte.
Fraud Risk Score
O score final combina o risco transacional das regras com o risco estrutural das entidades conectadas à transação.
Fórmula conceitual
fraud_risk_score =
0.45 * rule_score
+ 0.20 * account_graph_risk_score
+ 0.125 * device_graph_risk_score
+ 0.125 * beneficiary_graph_risk_score
+ 0.05 * ip_graph_risk_score
+ 0.05 * max_community_risk_score
Explicabilidade
Cada alerta recebe uma justificativa textual combinando regras acionadas e sinais estruturais de grafo.
Score final 82.4/100 — risco crítico.
Score de regras: 75.0/100.
Regras acionadas: dispositivo compartilhado; beneficiário concentrador;
rajada transacional horária.
Sinais de grafo: dispositivo com alto risco estrutural;
comunidade associada com alto risco.
Jornada dos notebooks
O projeto foi construído em uma sequência reprodutível de notebooks, do entendimento do domínio ao empacotamento executivo.
Domain Understanding CRISP-DM+
Ontologia, Business Language Model, taxonomia de fraudes e desenho inicial do Knowledge Graph.
Abrir notebookGenerate Synthetic Transactions
Geração de dados sintéticos com clientes, contas, transações, dispositivos, IPs e beneficiários.
Abrir notebookEDA Transactional Fraud
Análise exploratória dos padrões transacionais e identificação de sinais candidatos para regras antifraude.
Abrir notebookRules Engine Antifraud
Motor de regras explicáveis com severidade, pontuação, score e alertas priorizados.
Abrir notebookGraph Modeling Neo4j
Modelagem de nós e relacionamentos, scripts Cypher e manifesto de carga para Neo4j.
Abrir notebookGraph Algorithms Fraud Detection
Degree, PageRank, comunidades, Betweenness aproximado e ranking estrutural de entidades.
Abrir notebookFraud Risk Score Explainability
Score final combinando regras, risco de entidades, risco de comunidades e explicabilidade textual.
Abrir notebookExecutive Conclusion & Portfolio Packaging
Conclusão executiva, valor de negócio, limitações, ética, próximos passos e empacotamento.
Abrir notebookValor para fraude
Priorização de transações, contas, dispositivos, IPs e beneficiários com risco transacional e relacional.
Valor técnico
Pipeline reprodutível com dados sintéticos, regras, grafos, Cypher, algoritmos e score final.
Valor para portfólio
Case completo para demonstrar senioridade em dados, risco, fraude, Graph Analytics e explicabilidade.
Acesse o projeto completo
O repositório contém notebooks, documentação, scripts Cypher, relatórios e artefatos versionáveis do MVP.