Instalação do DBT e dependências
Guia passo a passo para configurar o ambiente com DBT, Python e GitHub.
🚀 Instalação do DBT e suas Dependências
Este guia explica como instalar o DBT (Data Build Tool), além de configurar o ambiente com Python e GitHub.
✅ Pré-requisitos
- Acesso ao terminal (Linux, macOS ou Windows)
- Permissões de administrador
1. Instalar o Python
1. Instalar o Python
O Python é uma linguagem de programação muito utilizada em projetos de ciência de dados, automação e engenharia de dados. O DBT (Data Build Tool) é distribuído como um pacote Python, ou seja, usamos o Python como base para instalar, configurar e executar o DBT no nosso ambiente.
Recomendamos instalar a última versão do Python via pyenv no Linux/macOS ou diretamente do site oficial no Windows.
macOS / Linux (com pyenv)
Windows
Baixe o instalador oficial em: https://www.python.org/downloads/windows/
Durante a instalação:
- Marque a opção “Add python.exe to PATH”
- Clique em Customize installation e ative a opção “Install pip”
- Finalize a instalação e reinicie o terminal
Verifique:
2. Instalar o Visual Studio Code
2. Instalar o Visual Studio Code
O Visual Studio Code (VS Code) é um editor de código leve e poderoso, muito utilizado em projetos com Python, DBT e Git.
Embora não seja obrigatório, recomendamos o uso do VS Code porque ele facilita:
- A navegação e edição dos arquivos .sql e .yml usados no DBT
- O controle de versão com Git através de uma interface gráfica simples
- A visualização de erros, highlights de sintaxe e integração com o terminal
Instalação
Baixe e instale o VS Code no site oficial:
👉 https://code.visualstudio.com/
Extensões recomendadas
Após instalar o VS Code, você pode adicionar algumas extensões úteis:
- Python (Microsoft) — para suporte ao ambiente virtual e sintaxe Python
- SQL (ou SQLTools) — para melhor experiência com arquivos .sql
- DBT Power User — extensão dedicada ao desenvolvimento com DBT
Essas ferramentas deixarão seu ambiente de trabalho mais produtivo e organizado.
3. Instalar o Git
3. Instalar o Git
O Git é um sistema de controle de versão distribuído. Ele é essencial para trabalharmos de forma colaborativa, mantendo o histórico de alterações e facilitando o versionamento dos nossos arquivos.
No nosso projeto, usaremos o Git para subir os modelos construídos com o DBT para o nosso repositório principal, que centraliza todos os modelos do nosso datalake. Isso garante rastreabilidade, colaboração e integração com os pipelines de dados.
macOS (via Homebrew)
Linux (via apt)
Windows
Baixe o instalador em: https://git-scm.com/download/win
Durante a instalação:
- Mantenha as opções padrão
- Marque o Visual Studio Code como editor padrão
- Ao final, reinicie o terminal
Verifique:
4. Criar e ativar um ambiente virtual Python
4. Criar e ativar um ambiente virtual Python
Ambientes virtuais Python são usados para isolar as dependências de um projeto. Isso significa que os pacotes que instalamos para o DBT não vão interferir em outros projetos nem conflitar com pacotes instalados globalmente no seu sistema.
Vamos criar um ambiente virtual chamado dbt-env, que usaremos exclusivamente para este projeto.
Linux/macOS
Criar o ambiente:
Ativar o ambiente:
Sempre que você for trabalhar com DBT, lembre-se de ativar o ambiente virtual com o comando abaixo.
Windows
Criar o ambiente:
Ativar o ambiente:
Sempre que você for trabalhar com DBT, lembre-se de ativar o ambiente virtual com o comando abaixo.
Desativar o ambiente (qualquer sistema):
5. Instalação do DBT
5. Instalação do DBT
O DBT (Data Build Tool) é uma ferramenta que permite transformar dados dentro do seu data warehouse usando apenas SQL e alguns comandos em linha de comando.
Para funcionar com diferentes tecnologias de Data Warehouse (como BigQuery, Snowflake, Postgres, Redshift, etc), o DBT utiliza adaptadores. Adaptadores são pacotes que permitem que o DBT se conecte e interaja com cada tipo específico de banco de dados.
No nosso caso, usaremos apenas o BigQuery, pois é onde nosso data lake está hospedado.
Vamos instalar então o DBT com o adaptador do BigQuery:
Verifique a instalação:
Saída esperada (exemplo):
6. Configurando variáveis de ambiente
6. Configurando variáveis de ambiente
Algumas variáveis de ambiente podem ser configuradas para personalizar o comportamento do DBT. Duas importantes são:
DBT_PROFILES_DIR
: define o diretório onde está o arquivoprofiles.yml
.DBT_USER
: valor opcional que pode ser utilizado em perfis personalizados ou scripts.
Vamos configurar essas variáveis nos sistemas Linux/macOS e Windows.
Linux/macOS
Você pode definir as variáveis de ambiente adicionando as linhas abaixo ao final do arquivo ~/.bashrc
, ~/.zshrc
ou outro arquivo de configuração do seu shell:
Depois de adicionar, execute:
Windows
No Windows, você pode configurar variáveis de ambiente temporariamente no terminal:
Ou:
- Abra o menu Iniciar e busque por “Variáveis de ambiente”.
- Clique em “Editar variáveis de ambiente do sistema”.
- Na seção “Variáveis de usuário”, clique em “Novo” e adicione:
- Nome da variável:
DBT_PROFILES_DIR
- Valor da variável:
C:\caminho\para\seu\diretorio
- Nome da variável:
- Repita o processo para
DBT_USER
.
Sempre que você for trabalhar com DBT, verifique se as variáveis de ambiente estão corretamente definidas, especialmente DBT_PROFILES_DIR
.
7. Configurar o GitHub (opcional, mas recomendado)
7. Configurar o GitHub (opcional, mas recomendado)
- Crie uma conta em github.com
- Configure o Git localmente:
🎉 Pronto!
Agora seu ambiente está preparado para iniciar projetos com o DBT.