Guia completo para colaborar com o repositório de queries da Prefeitura do Rio de Janeiro usando dbt e BigQuery
rj-iplanrio-dev
rj-iplanrio-dev
.
Nunca use o ambiente de produção para desenvolvimento.source
e ref
--select
para testar apenas seus modelos:
dbt build
, pois além de rodar os modelos, ele também executa seus testes.models/raw/secretaria/seu_projeto/
:
_raw_seu_projeto__sources.yml
_raw_seu_projeto__schema.yml
_raw_seu_projeto__sources.yml
:
_raw_seu_projeto__schema.yml
:
dbt_project.yml
Após criar os arquivos de metadados, você precisa adicionar a configuração da sua pasta no arquivo dbt_project.yml
do projeto. Isso permite que o DBT reconheça e processe seus modelos corretamente.
Exemplo de configuração no dbt_project.yml
:
+tags
: Define tags para organização e filtros (ex: daily, custos, sme).
daily
e weekly
são especialmente importantes: elas determinam a frequência com que o Prefect irá executar seu modelo automaticamente. Se você marcar um modelo com a tag daily
, o Prefect irá agendá-lo para rodar todos os dias; se marcar com weekly
, ele será executado semanalmente.+materialized
: Define como o modelo será materializado (table, view, incremental).+schema
: Define o dataset específico onde o modelo será criado.+project
: Define o projeto específico do BigQuery em que o modelo será criado..sql
em models/
ou edite um modelo existente.models/raw/secretaria/seu_projeto/seu_modelo.sql
ref()
para dependências internas e source()
para dados externos.rj-iplanrio-dev
e verifique se o dataset correspondente foi criado.main
dbt debug
para verificar configuraçõesdbt deps
dbt build -s 'state:modified+'
rj-iplanrio-dev
para cada execução do workflowdbt build
pr_prod
(Produção)manifest.json
no Google Cloud Storage para futuras execuções incrementaisrj-iplanrio-dev
.
Apenas após o merge na branch master é que os modelos são executados em produção.