📊 Data

data-governance-guide

Gouvernance des données incluant catalogues, lineage, qualité, ownership, politiques et metadata management.

⚡ Installation & lancement en 1 commande

Copiez-collez dans votre terminal : le skill s'installe dans ~/.claude/skills et Claude Code se lance directement dessus.

macOS / Linux
curl -fsSL https://raw.githubusercontent.com/khalilbenaz/claude-skills-collection/main/install.sh | sh -s -- data-governance-guide --launch
Windows (PowerShell)
iex "& { $(iwr -useb https://raw.githubusercontent.com/khalilbenaz/claude-skills-collection/main/install.ps1) } data-governance-guide -Launch"

🚀 Déjà installé ?

claude "/data-governance-guide"

Ou tapez /data-governance-guide dans une session Claude Code, ou décrivez simplement votre besoin — le skill se déclenche automatiquement via le skill-router.

🔑 Déclencheurs automatiques

Le skill s'active automatiquement quand votre demande contient :

data governancegouvernance donnéesdata catalogdata lineagemetadata

📦 Installation manuelle

git clone https://github.com/khalilbenaz/claude-skills-collection.git cp -r claude-skills-collection/data-skills/data-governance-guide ~/.claude/skills/

Source : data-skills/data-governance-guide

📖 Manuel

Data Governance Guide

Workflow

  1. Définir le framework de gouvernance — Établir la stratégie de gouvernance alignée sur les objectifs métier. Créer le comité de gouvernance (Data Governance Council). Définir les rôles : Data Owner (responsable métier), Data Steward (gardien qualité), Data Custodian (technique). Rédiger la charte de gouvernance.
  2. Déployer le catalogue de données — Implémenter un data catalog (Apache Atlas, Collibra, Alation, DataHub) pour inventorier tous les assets de données. Documenter chaque dataset : description, schéma, propriétaire, classification, fréquence de mise à jour. Automatiser la découverte avec des crawlers.
  3. Cartographier le data lineage — Tracer l'origine et les transformations de chaque donnée de la source au reporting. Implémenter le lineage automatique via les outils ETL (dbt, Airflow) et le catalog. Visualiser les dépendances pour l'analyse d'impact avant toute modification de schéma ou de pipeline.
  4. Implémenter la qualité des données — Définir les dimensions de qualité : complétude, exactitude, cohérence, fraîcheur, unicité. Implémenter des contrôles automatisés avec Great Expectations, dbt tests ou Soda. Configurer des alertes sur les violations de qualité. Mesurer un Data Quality Score global.
  5. Classifier et protéger les données — Définir les niveaux de classification (public, interne, confidentiel, restreint). Appliquer les politiques de masquage, anonymisation et rétention selon la classification. Implémenter le tagging automatique avec des outils de découverte de données sensibles (PII, PHI, PCI).
  6. Établir les politiques et standards — Rédiger les politiques de gestion des données : naming conventions, formats, rétention, accès, partage. Définir les data contracts entre les producteurs et consommateurs de données. Automatiser la conformité avec des policies-as-code.
  7. Gérer le cycle de vie des données — Définir les durées de rétention par type de données et réglementation (RGPD, HIPAA). Automatiser l'archivage et la suppression. Implémenter le droit à l'effacement. Gérer les versions et l'historisation des données de référence (master data).
  8. Mesurer et améliorer — Définir des KPIs de gouvernance : couverture du catalogue, score de qualité, conformité aux politiques, adoption par les équipes. Générer des rapports mensuels pour le comité de gouvernance. Itérer sur les processus en fonction des retours utilisateurs.

Règles