Pipeline ELT que transforma dados operacionais da plataforma Tour4Friends em inteligência de negócios — da ingestão em tempo real no Kafka até os dashboards no Power BI.
Eventos originais extraídos via CDC. Dados brutos sem transformação — fonte da verdade imutável do pipeline.
Dados limpos, tipados e convertidos via AWS Glue. Schema validado e particionado para queries eficientes.
Tabelas com regras de negócio aplicadas, prontas para consumo pelo Athena e Power BI.
| Fonte | MongoDB | Banco NoSQL operacional para registros de viagens e reservas |
| Ingestão | Apache Kafka | Streaming de eventos em tempo real via Change Data Capture |
| Processamento | AWS Glue (Spark) | Transformação e conversão de formatos JSON → Parquet |
| Armazenamento | Amazon S3 | Data Lake escalável organizado em camadas Medallion |
| Catálogo | Glue Data Catalog | Repositório central de metadados para governança e descoberta |
| Analytics | Athena + Power BI | SQL serverless sobre S3 com dashboards estratégicos |