Puis-je appeler Claude depuis Hermes Agent via RunAPI ?

Oui. Configurez RunAPI comme fournisseur custom:runapi dans Hermes Agent avec base_url https://runapi.ai/v1 et api_mode chat_completions. Définissez le modèle sur claude-opus-4.8 ou n'importe quelle autre variante Claude. La même RUNAPI_API_KEY gère les modèles de chat, d'image, de vidéo et de musique.

Comment la tarification RunAPI pour Claude se compare-t-elle à Anthropic direct ?

RunAPI facture 50% du tarif officiel d'Anthropic par token. Opus 4.8 coûte 7,50$/37,50$ par million de tokens d'entrée/sortie via RunAPI contre 15$/75$ en direct. Aucun abonnement ni engagement de volume requis.

Passer d'un modèle Claude à l'autre nécessite-t-il de reconfigurer Hermes Agent ?

Non. Changez uniquement le paramètre model dans votre configuration Hermes ou utilisez la commande /model pendant une session. Le fournisseur custom:runapi, base_url et la clé API restent les mêmes pour toutes les variantes Claude — Opus 4.8, Sonnet 4.6, Haiku 4.5 et les instantanés datés.

Puis-je utiliser l'API Messages Anthropic native depuis Hermes Agent ?

RunAPI expose à la fois /v1/chat/completions (compatible OpenAI, utilisé par le mode chat_completions de Hermes Agent) et /v1/messages (format Anthropic natif). L'endpoint natif prend en charge la réflexion étendue et les fonctionnalités spécifiques à Anthropic. Pour Hermes Agent, la voie compatible OpenAI couvre le chat standard et le streaming.

Quel modèle Claude choisir pour les tâches de codage dans Hermes Agent ?

Opus 4.8 pour les refactorisations multi-fichiers complexes et les décisions d'architecture. Sonnet 4.6 pour le codage quotidien — revues de pull requests, génération de tests et corrections de bugs. Haiku 4.5 pour l'autocomplétion rapide et les suggestions inline où la latence est plus importante que la profondeur.

HERMES + CLAUDE

Utiliser Claude dans Hermes Agent.

Anthropic Claude fournit Opus 4.8 pour une capacité maximale (contexte 200K, réflexion étendue), Sonnet 4.6 pour des performances équilibrées et Haiku 4.5 pour la vitesse. Hermes Agent appelle Claude via le fournisseur custom:runapi à 50% du tarif officiel par token d'Anthropic — même clé et base_url configurées pour le chat.

Obtenir une API Key Lire la documentation

une seule clé API · endpoint compatible OpenAI · facturation par token à -50%

Utilisez RunAPI pour envoyer une requête de complétion Claude via Hermes Agent.


  Exigences :

  - Utiliser le fournisseur custom:runapi déjà configuré dans Hermes Agent

  - Appeler l'endpoint chat completions de RunAPI à https://runapi.ai/v1/chat/completions

  - Définir le modèle sur "claude-opus-4.8"

  - La variable d'environnement RUNAPI_API_KEY fournit l'autorisation

  - La réponse est synchrone — le message assistant est retourné directement dans le corps de la réponse

  - Pour le streaming, définir "stream" sur true pour recevoir des événements server-sent

curl -X POST https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "claude-opus-4.8",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "Explain the difference between a mutex and a semaphore in three sentences."}
    ]
  }'

{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "model": "claude-opus-4.8",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "A mutex is a locking mechanism that allows only one thread to access a resource at a time..."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 24,
    "completion_tokens": 87,
    "total_tokens": 111
  }
}

Copiez la commande curl pour tester claude

FONCTIONNEMENT

Utiliser Claude dans Hermes Agent en trois étapes

Configurer RunAPI

Définissez la variable d'environnement RUNAPI_API_KEY. Si vous avez déjà ajouté RunAPI comme fournisseur custom:runapi dans Hermes Agent, la même clé et base_url fonctionnent pour Claude — changez le paramètre model sur claude-opus-4.8 dans votre configuration Hermes ou utilisez la commande /model.

export RUNAPI_API_KEY=runapi_xxx

Appeler Claude

Envoyez une requête POST à /v1/chat/completions avec le modèle défini sur claude-opus-4.8. Incluez un tableau messages avec au moins un message utilisateur. Définissez max_tokens pour contrôler la longueur de la réponse. Ajoutez "stream" true pour une sortie SSE token par token dans votre session Hermes.

POST /v1/chat/completions

Lire la réponse

L'endpoint retourne le message assistant de manière synchrone — aucun polling de tâche requis. Hermes Agent affiche la réponse inline. Les comptages d'utilisation de tokens sont inclus dans la réponse pour la transparence de facturation. Les réponses en streaming arrivent comme événements SSE pour un affichage en temps réel.

usage.total_tokens: 111

PARAMÈTRES

Paramètres API Claude (compatible OpenAI)

Paramètre	Type	Description
`model`	`string`	Requis. claude-opus-4.8, claude-sonnet-4.6, claude-haiku-4.5 ou toute variante Claude listée dans le catalogue RunAPI.
`messages`	`array`	Requis. Tableau d'objets de message avec les champs role (system, user, assistant) et content.
`max_tokens`	`integer`	Nombre maximum de tokens dans la réponse. Les valeurs par défaut varient selon le modèle — définissez explicitement pour une facturation prévisible.
`stream`	`boolean`	Si true, retourne des événements server-sent avec des deltas de tokens incrémentiels au lieu d'une seule réponse JSON.
`temperature`	`float`	Température d'échantillonnage entre 0 et 1. Des valeurs plus basses produisent une sortie plus déterministe.
`top_p`	`float`	Seuil d'échantillonnage nucleus. Alternative à temperature — utilisez l'un ou l'autre, pas les deux.

Qu'est-ce que Claude sur Hermes Agent ?

Claude est le LLM d'Anthropic, et Hermes Agent l'appelle via le fournisseur custom:runapi à la moitié du prix officiel Anthropic par token. Les trois niveaux -- Opus 4.8 (contexte 200K, réflexion étendue), Sonnet 4.6 (équilibre vitesse-qualité) et Haiku 4.5 (rapide et peu coûteux) -- fonctionnent tous via la même configuration de fournisseur. Passer de l'un à l'autre par requête en changeant uniquement le champ model, sans reconfiguration.

Cas d'utilisation de Claude

Construction d'agents IA avec utilisation d'outils et MCP

Utiliser l'appel de fonctions et la prise en charge du Model Context Protocol de Claude dans Hermes Agent pour construire des workflows automatisés multi-étapes qui lisent des fichiers, interrogent des bases de données et prennent des actions basées sur le raisonnement.

Génération et revue de code

Router les tâches de codage via Claude dans Hermes Agent -- Opus 4.8 pour les décisions d'architecture complexes et les refactorings multi-fichiers, Sonnet 4.6 pour les revues de pull request quotidiennes et la génération de tests.

Génération de contenu avec mise en cache des prompts

Générer des textes marketing, de la documentation ou des rapports à grande échelle en utilisant la mise en cache des prompts pour réduire les coûts lorsque le prompt système et le contexte restent identiques sur de nombreuses requêtes.

FAQ

Questions sur Claude + Hermes Agent

Configuration générale de Hermes Agent

Pas encore configuré ? Commencez par le guide de configuration RunAPI pour Hermes Agent.

Guide de configuration Hermes Agent →

Catalogue des modèles Claude

Voir toutes les variantes Claude, la tarification par token et les détails de la fenêtre de contexte.

Modèles Claude →

Essayez Claude dans Hermes Agent dès aujourd'hui.

Obtenez une clé RunAPI gratuite, configurez le fournisseur custom:runapi et commencez à utiliser Claude à 50% du tarif officiel Anthropic.

Parcourir les modèles →