Utiliser Claude dans Hermes Agent.
Anthropic Claude fournit Opus 4.8 pour une capacité maximale (contexte 200K, réflexion étendue), Sonnet 4.6 pour des performances équilibrées et Haiku 4.5 pour la vitesse. Hermes Agent appelle Claude via le fournisseur custom:runapi à 50% du tarif officiel par token d'Anthropic — même clé et base_url configurées pour le chat.
Utilisez RunAPI pour envoyer une requête de complétion Claude via Hermes Agent.
Exigences :
- Utiliser le fournisseur custom:runapi déjà configuré dans Hermes Agent
- Appeler l'endpoint chat completions de RunAPI à https://runapi.ai/v1/chat/completions
- Définir le modèle sur "claude-opus-4.8"
- La variable d'environnement RUNAPI_API_KEY fournit l'autorisation
- La réponse est synchrone — le message assistant est retourné directement dans le corps de la réponse
- Pour le streaming, définir "stream" sur true pour recevoir des événements server-sent
curl -X POST https://runapi.ai/v1/chat/completions \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "claude-opus-4.8",
"max_tokens": 1024,
"messages": [
{"role": "user", "content": "Explain the difference between a mutex and a semaphore in three sentences."}
]
}'
{
"id": "chatcmpl-abc123",
"object": "chat.completion",
"model": "claude-opus-4.8",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "A mutex is a locking mechanism that allows only one thread to access a resource at a time..."
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 24,
"completion_tokens": 87,
"total_tokens": 111
}
}
Utiliser Claude dans Hermes Agent en trois étapes
Configurer RunAPI
Définissez la variable d'environnement RUNAPI_API_KEY. Si vous avez déjà ajouté RunAPI comme fournisseur custom:runapi dans Hermes Agent, la même clé et base_url fonctionnent pour Claude — changez le paramètre model sur claude-opus-4.8 dans votre configuration Hermes ou utilisez la commande /model.
export RUNAPI_API_KEY=runapi_xxx
Appeler Claude
Envoyez une requête POST à /v1/chat/completions avec le modèle défini sur claude-opus-4.8. Incluez un tableau messages avec au moins un message utilisateur. Définissez max_tokens pour contrôler la longueur de la réponse. Ajoutez "stream" true pour une sortie SSE token par token dans votre session Hermes.
POST /v1/chat/completions
Lire la réponse
L'endpoint retourne le message assistant de manière synchrone — aucun polling de tâche requis. Hermes Agent affiche la réponse inline. Les comptages d'utilisation de tokens sont inclus dans la réponse pour la transparence de facturation. Les réponses en streaming arrivent comme événements SSE pour un affichage en temps réel.
usage.total_tokens: 111
Paramètres API Claude (compatible OpenAI)
| Paramètre | Type | Description |
|---|---|---|
model |
string |
Requis. claude-opus-4.8, claude-sonnet-4.6, claude-haiku-4.5 ou toute variante Claude listée dans le catalogue RunAPI. |
messages |
array |
Requis. Tableau d'objets de message avec les champs role (system, user, assistant) et content. |
max_tokens |
integer |
Nombre maximum de tokens dans la réponse. Les valeurs par défaut varient selon le modèle — définissez explicitement pour une facturation prévisible. |
stream |
boolean |
Si true, retourne des événements server-sent avec des deltas de tokens incrémentiels au lieu d'une seule réponse JSON. |
temperature |
float |
Température d'échantillonnage entre 0 et 1. Des valeurs plus basses produisent une sortie plus déterministe. |
top_p |
float |
Seuil d'échantillonnage nucleus. Alternative à temperature — utilisez l'un ou l'autre, pas les deux. |
Qu'est-ce que Claude sur Hermes Agent ?
Claude est le LLM d'Anthropic, et Hermes Agent l'appelle via le fournisseur custom:runapi à la moitié du prix officiel Anthropic par token. Les trois niveaux -- Opus 4.8 (contexte 200K, réflexion étendue), Sonnet 4.6 (équilibre vitesse-qualité) et Haiku 4.5 (rapide et peu coûteux) -- fonctionnent tous via la même configuration de fournisseur. Passer de l'un à l'autre par requête en changeant uniquement le champ model, sans reconfiguration.
Cas d'utilisation de Claude
Construction d'agents IA avec utilisation d'outils et MCP
Utiliser l'appel de fonctions et la prise en charge du Model Context Protocol de Claude dans Hermes Agent pour construire des workflows automatisés multi-étapes qui lisent des fichiers, interrogent des bases de données et prennent des actions basées sur le raisonnement.
Génération et revue de code
Router les tâches de codage via Claude dans Hermes Agent -- Opus 4.8 pour les décisions d'architecture complexes et les refactorings multi-fichiers, Sonnet 4.6 pour les revues de pull request quotidiennes et la génération de tests.
Génération de contenu avec mise en cache des prompts
Générer des textes marketing, de la documentation ou des rapports à grande échelle en utilisant la mise en cache des prompts pour réduire les coûts lorsque le prompt système et le contexte restent identiques sur de nombreuses requêtes.
Questions sur Claude + Hermes Agent
Oui. Configurez RunAPI comme fournisseur custom:runapi dans Hermes Agent avec base_url https://runapi.ai/v1 et api_mode chat_completions. Définissez le modèle sur claude-opus-4.8 ou n'importe quelle autre variante Claude. La même RUNAPI_API_KEY gère les modèles de chat, d'image, de vidéo et de musique.
RunAPI facture 50% du tarif officiel d'Anthropic par token. Opus 4.8 coûte 7,50$/37,50$ par million de tokens d'entrée/sortie via RunAPI contre 15$/75$ en direct. Aucun abonnement ni engagement de volume requis.
Non. Changez uniquement le paramètre model dans votre configuration Hermes ou utilisez la commande /model pendant une session. Le fournisseur custom:runapi, base_url et la clé API restent les mêmes pour toutes les variantes Claude — Opus 4.8, Sonnet 4.6, Haiku 4.5 et les instantanés datés.
RunAPI expose à la fois /v1/chat/completions (compatible OpenAI, utilisé par le mode chat_completions de Hermes Agent) et /v1/messages (format Anthropic natif). L'endpoint natif prend en charge la réflexion étendue et les fonctionnalités spécifiques à Anthropic. Pour Hermes Agent, la voie compatible OpenAI couvre le chat standard et le streaming.
Opus 4.8 pour les refactorisations multi-fichiers complexes et les décisions d'architecture. Sonnet 4.6 pour le codage quotidien — revues de pull requests, génération de tests et corrections de bugs. Haiku 4.5 pour l'autocomplétion rapide et les suggestions inline où la latence est plus importante que la profondeur.
Configuration générale de Hermes Agent
Pas encore configuré ? Commencez par le guide de configuration RunAPI pour Hermes Agent.
Guide de configuration Hermes Agent →Catalogue des modèles Claude
Voir toutes les variantes Claude, la tarification par token et les détails de la fenêtre de contexte.
Modèles Claude →Essayez Claude dans Hermes Agent dès aujourd'hui.
Obtenez une clé RunAPI gratuite, configurez le fournisseur custom:runapi et commencez à utiliser Claude à 50% du tarif officiel Anthropic.