---
title: &quot;Utiliser Claude dans Hermes Agent via RunAPI — Guide API LLM&quot;
url: &quot;https://runapi.ai/fr/hermes-claude.md&quot;
canonical: &quot;https://runapi.ai/fr/hermes-claude&quot;
locale: &quot;fr&quot;
model: &quot;claude&quot;
---

# Utiliser Claude dans Hermes Agent.

Anthropic Claude fournit Opus 4.8 pour une capacité maximale (contexte 200K, réflexion étendue), Sonnet 4.6 pour des performances équilibrées et Haiku 4.5 pour la vitesse. Hermes Agent appelle Claude via le fournisseur custom:runapi à 50% du tarif officiel par token d&#39;Anthropic — même clé et base_url configurées pour le chat.

## API example

```bash
curl -X POST https://runapi.ai/v1/chat/completions \
  -H &quot;Authorization: Bearer $RUNAPI_API_KEY&quot; \
  -H &quot;Content-Type: application/json&quot; \
  -d &#39;{
    &quot;model&quot;: &quot;claude-opus-4.8&quot;,
    &quot;max_tokens&quot;: 1024,
    &quot;messages&quot;: [
      {&quot;role&quot;: &quot;user&quot;, &quot;content&quot;: &quot;Explain the difference between a mutex and a semaphore in three sentences.&quot;}
    ]
  }&#39;

```

### Response

```json
{
  &quot;id&quot;: &quot;chatcmpl-abc123&quot;,
  &quot;object&quot;: &quot;chat.completion&quot;,
  &quot;model&quot;: &quot;claude-opus-4.8&quot;,
  &quot;choices&quot;: [
    {
      &quot;index&quot;: 0,
      &quot;message&quot;: {
        &quot;role&quot;: &quot;assistant&quot;,
        &quot;content&quot;: &quot;A mutex is a locking mechanism that allows only one thread to access a resource at a time...&quot;
      },
      &quot;finish_reason&quot;: &quot;stop&quot;
    }
  ],
  &quot;usage&quot;: {
    &quot;prompt_tokens&quot;: 24,
    &quot;completion_tokens&quot;: 87,
    &quot;total_tokens&quot;: 111
  }
}

```

## How it works

1. **Configurer RunAPI** — Définissez la variable d&#39;environnement RUNAPI_API_KEY. Si vous avez déjà ajouté RunAPI comme fournisseur custom:runapi dans Hermes Agent, la même clé et base_url fonctionnent pour Claude — changez le paramètre model sur claude-opus-4.8 dans votre configuration Hermes ou utilisez la commande /model.
2. **Appeler Claude** — Envoyez une requête POST à /v1/chat/completions avec le modèle défini sur claude-opus-4.8. Incluez un tableau messages avec au moins un message utilisateur. Définissez max_tokens pour contrôler la longueur de la réponse. Ajoutez &quot;stream&quot; true pour une sortie SSE token par token dans votre session Hermes.
3. **Lire la réponse** — L&#39;endpoint retourne le message assistant de manière synchrone — aucun polling de tâche requis. Hermes Agent affiche la réponse inline. Les comptages d&#39;utilisation de tokens sont inclus dans la réponse pour la transparence de facturation. Les réponses en streaming arrivent comme événements SSE pour un affichage en temps réel.

## Parameters

| Parameter | Type | Description |
|-----------|------|-------------|
| `model` | `string` | Requis. claude-opus-4.8, claude-sonnet-4.6, claude-haiku-4.5 ou toute variante Claude listée dans le catalogue RunAPI. |
| `messages` | `array` | Requis. Tableau d&#39;objets de message avec les champs role (system, user, assistant) et content. |
| `max_tokens` | `integer` | Nombre maximum de tokens dans la réponse. Les valeurs par défaut varient selon le modèle — définissez explicitement pour une facturation prévisible. |
| `stream` | `boolean` | Si true, retourne des événements server-sent avec des deltas de tokens incrémentiels au lieu d&#39;une seule réponse JSON. |
| `temperature` | `float` | Température d&#39;échantillonnage entre 0 et 1. Des valeurs plus basses produisent une sortie plus déterministe. |
| `top_p` | `float` | Seuil d&#39;échantillonnage nucleus. Alternative à temperature — utilisez l&#39;un ou l&#39;autre, pas les deux. |

## FAQ

### Puis-je appeler Claude depuis Hermes Agent via RunAPI ?

Oui. Configurez RunAPI comme fournisseur custom:runapi dans Hermes Agent avec base_url https://runapi.ai/v1 et api_mode chat_completions. Définissez le modèle sur claude-opus-4.8 ou n&#39;importe quelle autre variante Claude. La même RUNAPI_API_KEY gère les modèles de chat, d&#39;image, de vidéo et de musique.

### Comment la tarification RunAPI pour Claude se compare-t-elle à Anthropic direct ?

RunAPI facture 50% du tarif officiel d&#39;Anthropic par token. Opus 4.8 coûte 7,50$/37,50$ par million de tokens d&#39;entrée/sortie via RunAPI contre 15$/75$ en direct. Aucun abonnement ni engagement de volume requis.

### Passer d&#39;un modèle Claude à l&#39;autre nécessite-t-il de reconfigurer Hermes Agent ?

Non. Changez uniquement le paramètre model dans votre configuration Hermes ou utilisez la commande /model pendant une session. Le fournisseur custom:runapi, base_url et la clé API restent les mêmes pour toutes les variantes Claude — Opus 4.8, Sonnet 4.6, Haiku 4.5 et les instantanés datés.

### Puis-je utiliser l&#39;API Messages Anthropic native depuis Hermes Agent ?

RunAPI expose à la fois /v1/chat/completions (compatible OpenAI, utilisé par le mode chat_completions de Hermes Agent) et /v1/messages (format Anthropic natif). L&#39;endpoint natif prend en charge la réflexion étendue et les fonctionnalités spécifiques à Anthropic. Pour Hermes Agent, la voie compatible OpenAI couvre le chat standard et le streaming.

### Quel modèle Claude choisir pour les tâches de codage dans Hermes Agent ?

Opus 4.8 pour les refactorisations multi-fichiers complexes et les décisions d&#39;architecture. Sonnet 4.6 pour le codage quotidien — revues de pull requests, génération de tests et corrections de bugs. Haiku 4.5 pour l&#39;autocomplétion rapide et les suggestions inline où la latence est plus importante que la profondeur.


## Links

- [Guide de configuration Hermes Agent →](https://runapi.ai/fr/hermes-agent)
- [Modèles Claude →](https://runapi.ai/fr/models/claude)
- [Model catalog](https://runapi.ai/fr/models)
- [API docs](https://runapi.ai/fr/docs)