🤖 Agents IA

research-agent-designer

Design d'agents de recherche autonomes pour collecter, analyser et synthétiser de l'information.

⚡ Installation & lancement en 1 commande

Copiez-collez dans votre terminal : le skill s'installe dans ~/.claude/skills et Claude Code se lance directement dessus.

macOS / Linux
curl -fsSL https://raw.githubusercontent.com/khalilbenaz/claude-skills-collection/main/install.sh | sh -s -- research-agent-designer --launch
Windows (PowerShell)
iex "& { $(iwr -useb https://raw.githubusercontent.com/khalilbenaz/claude-skills-collection/main/install.ps1) } research-agent-designer -Launch"

🚀 Déjà installé ?

claude "/research-agent-designer"

Ou tapez /research-agent-designer dans une session Claude Code, ou décrivez simplement votre besoin — le skill se déclenche automatiquement via le skill-router.

🔑 Déclencheurs automatiques

Le skill s'active automatiquement quand votre demande contient :

research agentagent de rechercheagent webweb research agentdeep researchagent qui cherchecollecte d'information automatique

📦 Installation manuelle

git clone https://github.com/khalilbenaz/claude-skills-collection.git cp -r claude-skills-collection/agent-skills/research-agent-designer ~/.claude/skills/

Source : agent-skills/research-agent-designer

📖 Manuel

Research Agent Designer

Quand utiliser ce skill

Utilise ce skill pour concevoir un agent capable de mener des recherches autonomes sur le web ou dans des corpus documentaires : interroger des moteurs de recherche, lire des articles, extraire des données structurées, croiser des sources et produire un rapport synthétique. S'applique aux cas d'usage de veille concurrentielle, due diligence, fact-checking, recherche académique ou production de contenu documenté.

Workflow

  1. Architecture générale — Définis les quatre composantes : (a) couche de recherche (search tools, web fetcher), (b) couche d'extraction et parsing (HTML, PDF, tableaux), (c) couche d'analyse et synthèse (LLM fort), (d) couche de formatage output. Choisis entre architecture mono-agent avec outils multiples ou pipeline multi-agents (searcher → extractor → synthesizer).
  1. Tools de recherche — Intègre les APIs indispensables : Serper/SerpAPI pour Google Search, Tavily pour la recherche web structurée, fetcher d'URL (requests + newspaper3k), lecteur PDF (pypdf2, pdfplumber), Wikipedia API, Semantic Scholar pour la recherche académique. Wrappe chaque tool avec gestion d'erreur et retry.

```python from tavily import TavilyClient client = TavilyClient(api_key="...") results = client.search(query="...", search_depth="advanced", max_results=10) ```

  1. Stratégie de recherche itérative — Implémente un mécanisme de query generation : l'agent génère d'abord 3-5 requêtes initiales, analyse les résultats, identifie les lacunes, génère des requêtes de suivi plus précises (iterative deepening). Applique la triangulation multi-sources : minimum 3 sources indépendantes par claim important.
  1. Scraping et extraction de contenu — Extrait le contenu textuel proprement : utilise trafilatura ou readability-lxml pour nettoyer le HTML, camelot pour les tableaux PDF, BeautifulSoup pour les données structurées. Gère les pages JavaScript avec Playwright si nécessaire. Limite la taille du contenu extrait (max 10k tokens par source).

```python import trafilatura downloaded = trafilatura.fetch_url(url) text = trafilatura.extract(downloaded, include_tables=True, include_links=False) ```

  1. Évaluation des sources — Implémente un système de scoring : (a) crédibilité du domaine (whitelists/blacklists, Alexa rank), (b) fraîcheur de la date de publication, (c) détection de biais (opinion vs. fact), (d) cross-référencement (la même info apparaît-elle dans d'autres sources fiables ?). Attribue un score de confiance 0-1 à chaque source.
  1. Synthèse et analyse — À partir des documents extraits, l'agent effectue : extraction des thèmes principaux, comparaison des positions entre sources, détection des contradictions, résumé hiérarchique (executive summary + détails). Utilise un LLM avec un prompt structuré qui liste explicitement les sources utilisées.
  1. Citation et attribution rigoureuse — Chaque affirmation dans le rapport final doit être liée à sa source originale. Implémente un tracker de citations en JSON : {"claim": "...", "source_url": "...", "source_date": "...", "quote": "..."}. Formate les références en APA, Chicago ou Markdown selon le besoin.

```python citation_store = [] citation_store.append({ "claim": claim_text, "source_url": url, "source_title": title, "source_date": date, "verbatim_quote": quote }) ```

  1. Formatage de l'output — Génère un rapport structuré avec : (a) résumé exécutif (200-400 mots), (b) findings détaillés par thème, (c) tableau comparatif si pertinent, (d) niveau de confiance global et par section, (e) liste des sources avec scores. Propose plusieurs niveaux de détail selon le contexte (brief / standard / exhaustif).
  1. Raffinement itératif — Après le premier draft, l'agent identifie automatiquement les gaps : questions sans réponse, contradictions non résolues, sujets insuffisamment couverts. Génère une liste de follow-up queries et propose d'approfondir les sections faibles. Implémente un mécanisme de validation humaine avant chaque nouvelle itération coûteuse.
  1. Guardrails et limites — Applique des contraintes strictes : max 20-50 sources par recherche, budget temps (timeout global de 5-15 min), profondeur maximale (max 3 niveaux d'itération), restrictions de domaines si nécessaire. Log toutes les URLs visitées. Filtre le contenu inappropriate ou non pertinent avant injection dans le LLM.

Règles