🧠 AI / ML

model-fine-tuner

Guide pour le fine-tuning de modèles ML/LLM (LoRA, QLoRA, PEFT, datasets, hyperparamètres)

⚡ Installation & lancement en 1 commande

Copiez-collez dans votre terminal : le skill s'installe dans ~/.claude/skills et Claude Code se lance directement dessus.

macOS / Linux
curl -fsSL https://raw.githubusercontent.com/khalilbenaz/claude-skills-collection/main/install.sh | sh -s -- model-fine-tuner --launch
Windows (PowerShell)
iex "& { $(iwr -useb https://raw.githubusercontent.com/khalilbenaz/claude-skills-collection/main/install.ps1) } model-fine-tuner -Launch"

🚀 Déjà installé ?

claude "/model-fine-tuner"

Ou tapez /model-fine-tuner dans une session Claude Code, ou décrivez simplement votre besoin — le skill se déclenche automatiquement via le skill-router.

📦 Installation manuelle

git clone https://github.com/khalilbenaz/claude-skills-collection.git cp -r claude-skills-collection/ai-ml-skills/model-fine-tuner ~/.claude/skills/

Source : ai-ml-skills/model-fine-tuner

📖 Manuel

Model Fine-Tuner

Guide complet pour le fine-tuning de modèles de machine learning et de grands modèles de langage (LLM), en utilisant des techniques efficientes comme LoRA, QLoRA et PEFT.

Workflow

1. Analyser le cas d'usage et choisir le modèle de base

2. Préparer et valider le dataset de fine-tuning

3. Configurer la méthode de fine-tuning

4. Définir les hyperparamètres d'entraînement

5. Lancer l'entraînement avec monitoring

6. Évaluer le modèle fine-tuné

7. Fusionner et exporter le modèle

8. Itérer et optimiser

Rules

  1. Toujours établir une baseline : Mesurer les performances du modèle de base avant tout fine-tuning. Sans baseline, il est impossible de quantifier l'amélioration réelle apportée par le fine-tuning.
  1. Privilégier les méthodes PEFT pour les LLM : Utiliser LoRA ou QLoRA plutôt qu'un fine-tuning complet sauf si les ressources le permettent et que la tâche l'exige. Cela réduit drastiquement la mémoire et le temps d'entraînement.
  1. Ne jamais entraîner sans set de validation : Toujours surveiller la loss de validation pour détecter le surapprentissage. Un modèle qui performe bien sur le train set mais mal sur le validation set est inutilisable en production.
  1. Versionner chaque expérience : Enregistrer systématiquement les hyperparamètres, le dataset utilisé, les métriques et les checkpoints. La reproductibilité est essentielle pour comparer et itérer efficacement.
  1. Vérifier la qualité des données avant tout : Un dataset de mauvaise qualité produira un modèle de mauvaise qualité, indépendamment de la sophistication de la méthode de fine-tuning. Investir du temps dans la curation des données est toujours rentable.