Extração e Carga de Dados

Visão Geral

Os pipelines de Extração e Carga de dados são responsáveis por levar os dados até a primeira camada de dados dentro do BigQuery, a camada bronze (etapa staging):

Os nossos pipelines de extração e carga de dados são públicos e estão disponíveis nos seguintes repositórios:

Para usar os repositórios, use a seguinte documentação: Criação de pipelines

Conhecimentos Necessários

Para desenvolver um pipeline de extração e carga de dados, é necessário os seguintes conhecimentos:

Linguagem Python para montar os scripts de extração e carga.
Versionamento de código em Git.
Ferramenta Prefect para orquestração dos scripts Python.

Onde Aprender

Para aprender a extrair e carregar os dados no Data Lake, consulte:

Criação de Pipelines — passo a passo para construir um novo pipeline
Prefect: Construindo uma Pipeline — configuração e deploy no Prefect
Repositório pipelines_rj_sms — exemplos de pipelines de saúde (SMS)
Repositório prefect_rj_iplanrio — pipelines gerais da IplanRio

Visão Geral

Guia de Desenvolvimento

Acesso aos Dados

Visão Geral

Conhecimentos Necessários

Onde Aprender

​Visão Geral

​Conhecimentos Necessários

​Onde Aprender

Visão Geral

Conhecimentos Necessários

Onde Aprender