Data Lake
Infraestrutura de dados da Prefeitura do Rio de Janeiro
Data Lake
O Data Lake da Prefeitura do Rio é a infraestrutura central de dados que permite a coleta, processamento e disponibilização de dados estratégicos das secretarias municipais, desenvolvida e mantida pela IplanRio.
Arquitetura
Ingestão de Dados
Processos e ferramentas para coleta de dados das secretarias municipais.
Processamento
Pipeline de transformação e enriquecimento dos dados municipais.
Armazenamento
Estrutura de armazenamento e organização dos dados da Prefeitura.
Consumo
Métodos e ferramentas para acesso aos dados processados pelas secretarias.
TODO
- Documentar arquitetura detalhada do Data Lake
- Adicionar diagramas de fluxo de dados entre secretarias
- Listar todas as fontes de dados municipais integradas
- Documentar processos de ETL/ELT específicos da Prefeitura
- Adicionar guias de uso das ferramentas
- Criar documentação de monitoramento
- Adicionar exemplos de queries comuns
- Documentar políticas de retenção de dados municipais