Usa Claude in Hermes Agent.
Anthropic Claude offre Opus 4.8 per la massima capacità (200K contesto, ragionamento esteso), Sonnet 4.6 per prestazioni bilanciate e Haiku 4.5 per la velocità. Hermes Agent chiama Claude tramite il provider custom:runapi al 50% della tariffa ufficiale Anthropic per token — stessa key e base_url configurate per la chat.
Usa RunAPI per inviare una richiesta di chat completion Claude tramite Hermes Agent.
Requisiti:
- Usa il provider custom:runapi già configurato in Hermes Agent
- Chiama l'endpoint chat completions di RunAPI su https://runapi.ai/v1/chat/completions
- Imposta model su "claude-opus-4.8"
- La variabile d'ambiente RUNAPI_API_KEY fornisce l'autorizzazione
- La risposta è sincrona — il messaggio dell'assistente viene restituito direttamente nel corpo della risposta
- Per lo streaming, imposta "stream": true per ricevere server-sent events
curl -X POST https://runapi.ai/v1/chat/completions \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "claude-opus-4.8",
"max_tokens": 1024,
"messages": [
{"role": "user", "content": "Explain the difference between a mutex and a semaphore in three sentences."}
]
}'
{
"id": "chatcmpl-abc123",
"object": "chat.completion",
"model": "claude-opus-4.8",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "A mutex is a locking mechanism that allows only one thread to access a resource at a time..."
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 24,
"completion_tokens": 87,
"total_tokens": 111
}
}
Usa Claude in Hermes Agent in tre passaggi
Configura RunAPI
Imposta la variabile d'ambiente RUNAPI_API_KEY. Se hai già aggiunto RunAPI come provider custom:runapi in Hermes Agent, la stessa key e base_url funzionano per Claude — cambia il parametro model su claude-opus-4.8 nella tua configurazione Hermes o usa il comando /model.
export RUNAPI_API_KEY=runapi_xxx
Chiama Claude
Invia una richiesta POST a /v1/chat/completions con model impostato su claude-opus-4.8. Includi un array messages con almeno un messaggio utente. Imposta max_tokens per controllare la lunghezza della risposta. Aggiungi "stream" true per output SSE token per token nella tua sessione Hermes.
POST /v1/chat/completions
Leggi la risposta
L'endpoint restituisce il messaggio dell'assistente in modo sincrono — nessun polling dei task necessario. Hermes Agent mostra la risposta inline. I conteggi dei token sono inclusi nella risposta per la trasparenza della fatturazione. Le risposte in streaming arrivano come eventi SSE per la visualizzazione in tempo reale.
usage.total_tokens: 111
Parametri API Claude (OpenAI-compatibile)
| Parametro | Tipo | Descrizione |
|---|---|---|
model |
string |
Obbligatorio. claude-opus-4.8, claude-sonnet-4.6, claude-haiku-4.5, o qualsiasi variante Claude elencata nel catalogo RunAPI. |
messages |
array |
Obbligatorio. Array di oggetti messaggio con i campi role (system, user, assistant) e content. |
max_tokens |
integer |
Numero massimo di token nella risposta. I valori predefiniti variano per modello — imposta esplicitamente per una fatturazione prevedibile. |
stream |
boolean |
Se true, restituisce server-sent events con delta di token incrementali invece di una singola risposta JSON. |
temperature |
float |
Temperatura di campionamento tra 0 e 1. Valori più bassi producono output più deterministico. |
top_p |
float |
Soglia di campionamento nucleus. Alternativa alla temperatura — usa uno o l'altro, non entrambi. |
Cos'è Claude su Hermes Agent?
Claude è l'LLM di Anthropic, e Hermes Agent lo chiama tramite il provider custom:runapi alla metà del prezzo ufficiale Anthropic per token. I tre livelli -- Opus 4.8 (contesto 200K, pensiero esteso), Sonnet 4.6 (velocità e qualità bilanciate) e Haiku 4.5 (veloce ed economico) -- funzionano tutti tramite la stessa configurazione del provider. Passare tra di loro per richiesta cambiando solo il campo model, senza necessità di riconfigurazione.
Casi d'uso di Claude
Costruzione di agenti IA con uso degli strumenti e MCP
Usare le chiamate a funzioni e il supporto al Model Context Protocol di Claude in Hermes Agent per costruire workflow automatizzati multi-step che leggono file, interrogano database e intraprendono azioni basate sul ragionamento.
Generazione e revisione del codice
Instradare i task di codifica tramite Claude in Hermes Agent -- Opus 4.8 per decisioni architetturali complesse e refactoring multi-file, Sonnet 4.6 per le revisioni quotidiane di pull request e la generazione di test.
Generazione di contenuto con prompt caching
Generare testi di marketing, documentazione o report su larga scala usando il prompt caching per ridurre i costi quando il prompt di sistema e il contesto rimangono gli stessi su molte richieste.
Domande su Claude + Hermes Agent
Sì. Configura RunAPI come provider custom:runapi in Hermes Agent con base_url https://runapi.ai/v1 e api_mode chat_completions. Imposta model su claude-opus-4.8 o qualsiasi altra variante Claude. La stessa RUNAPI_API_KEY gestisce modelli di chat, immagini, video e musica.
RunAPI addebita il 50% della tariffa ufficiale Anthropic per token. Opus 4.8 costa $7,50/$37,50 per milione di token di input/output tramite RunAPI rispetto a $15/$75 direttamente. Nessun abbonamento o impegno di volume richiesto.
No. Cambia solo il parametro model nella tua configurazione Hermes o usa il comando /model durante una sessione. Il provider custom:runapi, il base_url e la API key rimangono gli stessi per tutte le varianti Claude — Opus 4.8, Sonnet 4.6, Haiku 4.5 e snapshot con data.
RunAPI espone sia /v1/chat/completions (OpenAI-compatibile, usato dalla modalità chat_completions di Hermes Agent) sia /v1/messages (formato nativo Anthropic). L'endpoint nativo supporta il ragionamento esteso e le funzionalità specifiche di Anthropic. Per Hermes Agent, il percorso OpenAI-compatibile copre chat standard e streaming.
Opus 4.8 per refactoring complessi su più file e decisioni architetturali. Sonnet 4.6 per la programmazione quotidiana — revisioni di pull request, generazione di test e correzione di bug. Haiku 4.5 per autocompletamento rapido e suggerimenti inline dove la latenza conta più della profondità.
Configurazione generale di Hermes Agent
Non ancora configurato? Inizia con la guida di configurazione RunAPI per Hermes Agent.
Guida di configurazione di Hermes Agent →Catalogo modelli Claude
Vedi tutte le varianti Claude, i prezzi per token e i dettagli sulla finestra di contesto.
Modelli Claude →Prova Claude in Hermes Agent oggi.
Ottieni una API key RunAPI gratuita, configura il provider custom:runapi e inizia a usare Claude al 50% del prezzo ufficiale Anthropic.