📊 Data

dbt-guide

Transformation de données avec dbt — models, tests, sources, macros et documentation automatisée.

⚡ Installation & lancement en 1 commande

Copiez-collez dans votre terminal : le skill s'installe dans ~/.claude/skills et Claude Code se lance directement dessus.

macOS / Linux
curl -fsSL https://raw.githubusercontent.com/khalilbenaz/claude-skills-collection/main/install.sh | sh -s -- dbt-guide --launch
Windows (PowerShell)
iex "& { $(iwr -useb https://raw.githubusercontent.com/khalilbenaz/claude-skills-collection/main/install.ps1) } dbt-guide -Launch"

🚀 Déjà installé ?

claude "/dbt-guide"

Ou tapez /dbt-guide dans une session Claude Code, ou décrivez simplement votre besoin — le skill se déclenche automatiquement via le skill-router.

🔑 Déclencheurs automatiques

Le skill s'active automatiquement quand votre demande contient :

dbtdata build tooldbt modeldbt testtransformation de données dbt

📦 Installation manuelle

git clone https://github.com/khalilbenaz/claude-skills-collection.git cp -r claude-skills-collection/data-skills/dbt-guide ~/.claude/skills/

Source : data-skills/dbt-guide

📖 Manuel

Guide dbt

Workflow

  1. Structurer le projet dbt — Organiser le projet avec la convention de couches : staging/ (nettoyage des sources brutes, renommage, typage), intermediate/ (jointures et transformations métier), marts/ (modèles finaux orientés consommation). Configurer dbt_project.yml avec les materialization par défaut par dossier.
  1. Déclarer les sources — Définir les sources de données brutes dans sources.yml avec le nom, le schéma, les tables, les descriptions, et les tests de freshness (loaded_at_field, warn_after, error_after). Référencer les sources avec {{ source() }} dans les modèles.
  1. Développer les modèles — Écrire les modèles SQL avec les ref() pour les dépendances entre modèles, choisir la materialisation adaptée (view, table, incremental, ephemeral), et configurer les modèles incrémentaux avec is_incremental() et la stratégie de merge appropriée.
  1. Implémenter les tests — Définir les tests de données dans les fichiers YAML : tests génériques (unique, not_null, accepted_values, relationships), tests custom en SQL dans tests/, et tests de source pour valider la qualité des données entrantes.
  1. Créer les macros — Développer des macros Jinja réutilisables pour les patterns récurrents : génération de surrogate keys, pivot/unpivot, date spine, audit columns (created_at, updated_at), et logique métier partagée entre modèles.
  1. Documenter le projet — Rédiger les descriptions des modèles et colonnes dans les fichiers YAML, générer le site de documentation avec dbt docs generate et dbt docs serve, et maintenir le lineage graph à jour pour la traçabilité des transformations.
  1. Configurer les environnements — Séparer les configurations par environnement (dev, staging, prod) avec les profiles dbt, les target schemas distincts, et les variables d'environnement. Intégrer dbt dans le pipeline CI/CD avec dbt build et dbt test.

Règles