HERMES + CLAUDE

Utiliser Claude dans Hermes Agent.

Anthropic Claude fournit Opus 4.8 pour une capacité maximale (contexte 200K, réflexion étendue), Sonnet 4.6 pour des performances équilibrées et Haiku 4.5 pour la vitesse. Hermes Agent appelle Claude via le fournisseur custom:runapi à 50% du tarif officiel par token d'Anthropic — même clé et base_url configurées pour le chat.

une seule clé API · endpoint compatible OpenAI · facturation par token à -50%
Utilisez RunAPI pour envoyer une requête de complétion Claude via Hermes Agent.


  Exigences :

  - Utiliser le fournisseur custom:runapi déjà configuré dans Hermes Agent

  - Appeler l'endpoint chat completions de RunAPI à https://runapi.ai/v1/chat/completions

  - Définir le modèle sur "claude-opus-4.8"

  - La variable d'environnement RUNAPI_API_KEY fournit l'autorisation

  - La réponse est synchrone — le message assistant est retourné directement dans le corps de la réponse

  - Pour le streaming, définir "stream" sur true pour recevoir des événements server-sent

  
curl -X POST https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "claude-opus-4.8",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "Explain the difference between a mutex and a semaphore in three sentences."}
    ]
  }'
{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "model": "claude-opus-4.8",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "A mutex is a locking mechanism that allows only one thread to access a resource at a time..."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 24,
    "completion_tokens": 87,
    "total_tokens": 111
  }
}
Copiez la commande curl pour tester claude
FONCTIONNEMENT

Utiliser Claude dans Hermes Agent en trois étapes

1

Configurer RunAPI

Définissez la variable d'environnement RUNAPI_API_KEY. Si vous avez déjà ajouté RunAPI comme fournisseur custom:runapi dans Hermes Agent, la même clé et base_url fonctionnent pour Claude — changez le paramètre model sur claude-opus-4.8 dans votre configuration Hermes ou utilisez la commande /model.

export RUNAPI_API_KEY=runapi_xxx
2

Appeler Claude

Envoyez une requête POST à /v1/chat/completions avec le modèle défini sur claude-opus-4.8. Incluez un tableau messages avec au moins un message utilisateur. Définissez max_tokens pour contrôler la longueur de la réponse. Ajoutez "stream" true pour une sortie SSE token par token dans votre session Hermes.

POST /v1/chat/completions
3

Lire la réponse

L'endpoint retourne le message assistant de manière synchrone — aucun polling de tâche requis. Hermes Agent affiche la réponse inline. Les comptages d'utilisation de tokens sont inclus dans la réponse pour la transparence de facturation. Les réponses en streaming arrivent comme événements SSE pour un affichage en temps réel.

usage.total_tokens: 111
PARAMÈTRES

Paramètres API Claude (compatible OpenAI)

Paramètre Type Description
model string Requis. claude-opus-4.8, claude-sonnet-4.6, claude-haiku-4.5 ou toute variante Claude listée dans le catalogue RunAPI.
messages array Requis. Tableau d'objets de message avec les champs role (system, user, assistant) et content.
max_tokens integer Nombre maximum de tokens dans la réponse. Les valeurs par défaut varient selon le modèle — définissez explicitement pour une facturation prévisible.
stream boolean Si true, retourne des événements server-sent avec des deltas de tokens incrémentiels au lieu d'une seule réponse JSON.
temperature float Température d'échantillonnage entre 0 et 1. Des valeurs plus basses produisent une sortie plus déterministe.
top_p float Seuil d'échantillonnage nucleus. Alternative à temperature — utilisez l'un ou l'autre, pas les deux.

Qu'est-ce que Claude sur Hermes Agent ?

Claude est le LLM d'Anthropic, et Hermes Agent l'appelle via le fournisseur custom:runapi à la moitié du prix officiel Anthropic par token. Les trois niveaux -- Opus 4.8 (contexte 200K, réflexion étendue), Sonnet 4.6 (équilibre vitesse-qualité) et Haiku 4.5 (rapide et peu coûteux) -- fonctionnent tous via la même configuration de fournisseur. Passer de l'un à l'autre par requête en changeant uniquement le champ model, sans reconfiguration.

Cas d'utilisation de Claude

Construction d'agents IA avec utilisation d'outils et MCP

Utiliser l'appel de fonctions et la prise en charge du Model Context Protocol de Claude dans Hermes Agent pour construire des workflows automatisés multi-étapes qui lisent des fichiers, interrogent des bases de données et prennent des actions basées sur le raisonnement.

Génération et revue de code

Router les tâches de codage via Claude dans Hermes Agent -- Opus 4.8 pour les décisions d'architecture complexes et les refactorings multi-fichiers, Sonnet 4.6 pour les revues de pull request quotidiennes et la génération de tests.

Génération de contenu avec mise en cache des prompts

Générer des textes marketing, de la documentation ou des rapports à grande échelle en utilisant la mise en cache des prompts pour réduire les coûts lorsque le prompt système et le contexte restent identiques sur de nombreuses requêtes.

FAQ

Questions sur Claude + Hermes Agent

Configuration générale de Hermes Agent

Pas encore configuré ? Commencez par le guide de configuration RunAPI pour Hermes Agent.

Guide de configuration Hermes Agent →

Catalogue des modèles Claude

Voir toutes les variantes Claude, la tarification par token et les détails de la fenêtre de contexte.

Modèles Claude →

Essayez Claude dans Hermes Agent dès aujourd'hui.

Obtenez une clé RunAPI gratuite, configurez le fournisseur custom:runapi et commencez à utiliser Claude à 50% du tarif officiel Anthropic.