Visão Geral

Os pipelines de Extração e Carga de dados são responsáveis por levar os dados até a primeira camada de dados dentro do BigQuery, a camada bronze (etapa staging): Extracao Os nossos pipelines de extração e carga de dados são públicos e estão disponíveis nos seguintes repositórios: Para usar os repositórios, use a seguinte documentação: Criação de pipelines

Conhecimentos Necessários

Para desenvolver um pipeline de extração e carga de dados, é necessário os seguintes conhecimentos:
  • Linguagem Python para montar os scripts de extração e carga.
  • Versionamento de código em Git.
  • Ferramenta Prefect para orquestração dos scripts Python.

Onde Aprender

Para aprender a extrair e carregar os dados no Data Lake, indicamos consumir o material desenvolvido pelo Escritório de Dados: