🧠 AI / ML

ml-experiment-tracker

Suivi d'expériences ML avec MLflow, W&B, versioning de modèles et comparaison de métriques

⚡ Installation & lancement en 1 commande

Copiez-collez dans votre terminal : le skill s'installe dans ~/.claude/skills et Claude Code se lance directement dessus.

macOS / Linux
curl -fsSL https://raw.githubusercontent.com/khalilbenaz/claude-skills-collection/main/install.sh | sh -s -- ml-experiment-tracker --launch
Windows (PowerShell)
iex "& { $(iwr -useb https://raw.githubusercontent.com/khalilbenaz/claude-skills-collection/main/install.ps1) } ml-experiment-tracker -Launch"

🚀 Déjà installé ?

claude "/ml-experiment-tracker"

Ou tapez /ml-experiment-tracker dans une session Claude Code, ou décrivez simplement votre besoin — le skill se déclenche automatiquement via le skill-router.

📦 Installation manuelle

git clone https://github.com/khalilbenaz/claude-skills-collection.git cp -r claude-skills-collection/ai-ml-skills/ml-experiment-tracker ~/.claude/skills/

Source : ai-ml-skills/ml-experiment-tracker

📖 Manuel

ML Experiment Tracker

Guide complet pour le suivi structuré d'expériences de machine learning, le versioning de modèles et la comparaison systématique des métriques.

Workflow

1. Choisir et configurer la plateforme de tracking

2. Structurer les expériences

3. Logger les paramètres et hyperparamètres

4. Suivre les métriques en temps réel

5. Versionner les artefacts

6. Comparer et analyser les résultats

7. Gérer le Model Registry

8. Automatiser et industrialiser

Rules

  1. Logger avant de lancer : Configurer le tracking complet avant de démarrer l'entraînement. Un run sans logs est un run perdu. Il est impossible de recréer les conditions exactes d'une expérience après coup.
  1. Un run = une configuration : Chaque modification d'hyperparamètre, de dataset ou de code doit correspondre à un nouveau run. Ne jamais écraser un run existant, même en cas d'erreur.
  1. Métriques reproductibles : Toujours fixer et enregistrer le random seed, la version exacte des librairies et le hash du code. Deux runs avec les mêmes paramètres doivent produire des résultats identiques (ou quasi-identiques sur GPU).
  1. Nommer et taguer systématiquement : Un run sans nom descriptif ni tags est inutilisable pour la comparaison future. Appliquer la convention de nommage de l'équipe sans exception.
  1. Nettoyer régulièrement : Archiver ou supprimer les runs exploratoires obsolètes. Un espace de tracking encombré ralentit la recherche et masque les résultats importants.