---
title: &quot;Usa Claude in Hermes Agent tramite RunAPI — Guida API LLM&quot;
url: &quot;https://runapi.ai/it/hermes-claude.md&quot;
canonical: &quot;https://runapi.ai/it/hermes-claude&quot;
locale: &quot;it&quot;
model: &quot;claude&quot;
---

# Usa Claude in Hermes Agent.

Anthropic Claude offre Opus 4.8 per la massima capacità (200K contesto, ragionamento esteso), Sonnet 4.6 per prestazioni bilanciate e Haiku 4.5 per la velocità. Hermes Agent chiama Claude tramite il provider custom:runapi al 50% della tariffa ufficiale Anthropic per token — stessa key e base_url configurate per la chat.

## API example

```bash
curl -X POST https://runapi.ai/v1/chat/completions \
  -H &quot;Authorization: Bearer $RUNAPI_API_KEY&quot; \
  -H &quot;Content-Type: application/json&quot; \
  -d &#39;{
    &quot;model&quot;: &quot;claude-opus-4.8&quot;,
    &quot;max_tokens&quot;: 1024,
    &quot;messages&quot;: [
      {&quot;role&quot;: &quot;user&quot;, &quot;content&quot;: &quot;Explain the difference between a mutex and a semaphore in three sentences.&quot;}
    ]
  }&#39;

```

### Response

```json
{
  &quot;id&quot;: &quot;chatcmpl-abc123&quot;,
  &quot;object&quot;: &quot;chat.completion&quot;,
  &quot;model&quot;: &quot;claude-opus-4.8&quot;,
  &quot;choices&quot;: [
    {
      &quot;index&quot;: 0,
      &quot;message&quot;: {
        &quot;role&quot;: &quot;assistant&quot;,
        &quot;content&quot;: &quot;A mutex is a locking mechanism that allows only one thread to access a resource at a time...&quot;
      },
      &quot;finish_reason&quot;: &quot;stop&quot;
    }
  ],
  &quot;usage&quot;: {
    &quot;prompt_tokens&quot;: 24,
    &quot;completion_tokens&quot;: 87,
    &quot;total_tokens&quot;: 111
  }
}

```

## How it works

1. **Configura RunAPI** — Imposta la variabile d&#39;ambiente RUNAPI_API_KEY. Se hai già aggiunto RunAPI come provider custom:runapi in Hermes Agent, la stessa key e base_url funzionano per Claude — cambia il parametro model su claude-opus-4.8 nella tua configurazione Hermes o usa il comando /model.
2. **Chiama Claude** — Invia una richiesta POST a /v1/chat/completions con model impostato su claude-opus-4.8. Includi un array messages con almeno un messaggio utente. Imposta max_tokens per controllare la lunghezza della risposta. Aggiungi &quot;stream&quot; true per output SSE token per token nella tua sessione Hermes.
3. **Leggi la risposta** — L&#39;endpoint restituisce il messaggio dell&#39;assistente in modo sincrono — nessun polling dei task necessario. Hermes Agent mostra la risposta inline. I conteggi dei token sono inclusi nella risposta per la trasparenza della fatturazione. Le risposte in streaming arrivano come eventi SSE per la visualizzazione in tempo reale.

## Parameters

| Parameter | Type | Description |
|-----------|------|-------------|
| `model` | `string` | Obbligatorio. claude-opus-4.8, claude-sonnet-4.6, claude-haiku-4.5, o qualsiasi variante Claude elencata nel catalogo RunAPI. |
| `messages` | `array` | Obbligatorio. Array di oggetti messaggio con i campi role (system, user, assistant) e content. |
| `max_tokens` | `integer` | Numero massimo di token nella risposta. I valori predefiniti variano per modello — imposta esplicitamente per una fatturazione prevedibile. |
| `stream` | `boolean` | Se true, restituisce server-sent events con delta di token incrementali invece di una singola risposta JSON. |
| `temperature` | `float` | Temperatura di campionamento tra 0 e 1. Valori più bassi producono output più deterministico. |
| `top_p` | `float` | Soglia di campionamento nucleus. Alternativa alla temperatura — usa uno o l&#39;altro, non entrambi. |

## FAQ

### Posso chiamare Claude da Hermes Agent tramite RunAPI?

Sì. Configura RunAPI come provider custom:runapi in Hermes Agent con base_url https://runapi.ai/v1 e api_mode chat_completions. Imposta model su claude-opus-4.8 o qualsiasi altra variante Claude. La stessa RUNAPI_API_KEY gestisce modelli di chat, immagini, video e musica.

### Come si confrontano i prezzi Claude di RunAPI rispetto ad Anthropic diretto?

RunAPI addebita il 50% della tariffa ufficiale Anthropic per token. Opus 4.8 costa $7,50/$37,50 per milione di token di input/output tramite RunAPI rispetto a $15/$75 direttamente. Nessun abbonamento o impegno di volume richiesto.

### Passare tra modelli Claude richiede di riconfigurare Hermes Agent?

No. Cambia solo il parametro model nella tua configurazione Hermes o usa il comando /model durante una sessione. Il provider custom:runapi, il base_url e la API key rimangono gli stessi per tutte le varianti Claude — Opus 4.8, Sonnet 4.6, Haiku 4.5 e snapshot con data.

### Posso usare la native Anthropic Messages API da Hermes Agent?

RunAPI espone sia /v1/chat/completions (OpenAI-compatibile, usato dalla modalità chat_completions di Hermes Agent) sia /v1/messages (formato nativo Anthropic). L&#39;endpoint nativo supporta il ragionamento esteso e le funzionalità specifiche di Anthropic. Per Hermes Agent, il percorso OpenAI-compatibile copre chat standard e streaming.

### Quale modello Claude scegliere per task di programmazione in Hermes Agent?

Opus 4.8 per refactoring complessi su più file e decisioni architetturali. Sonnet 4.6 per la programmazione quotidiana — revisioni di pull request, generazione di test e correzione di bug. Haiku 4.5 per autocompletamento rapido e suggerimenti inline dove la latenza conta più della profondità.


## Links

- [Guida di configurazione di Hermes Agent →](https://runapi.ai/it/hermes-agent)
- [Modelli Claude →](https://runapi.ai/it/models/claude)
- [Model catalog](https://runapi.ai/it/models)
- [API docs](https://runapi.ai/it/docs)