---
title: &quot;Usa Claude en Hermes Agent con RunAPI — Guía de API LLM&quot;
url: &quot;https://runapi.ai/pt-BR/hermes-claude.md&quot;
canonical: &quot;https://runapi.ai/pt-BR/hermes-claude&quot;
locale: &quot;pt-BR&quot;
model: &quot;claude&quot;
---

# Usa Claude en Hermes Agent.

Anthropic Claude ofrece Opus 4.8 para máxima capacidad (200K de contexto, extended thinking), Sonnet 4.6 para rendimiento equilibrado y Haiku 4.5 para velocidad. Hermes Agent llama a Claude a través del proveedor custom:runapi al 50% de la tarifa oficial por token de Anthropic — la misma clave y base_url que configuraste para chat.

## API example

```bash
curl -X POST https://runapi.ai/v1/chat/completions \
  -H &quot;Authorization: Bearer $RUNAPI_API_KEY&quot; \
  -H &quot;Content-Type: application/json&quot; \
  -d &#39;{
    &quot;model&quot;: &quot;claude-opus-4.8&quot;,
    &quot;max_tokens&quot;: 1024,
    &quot;messages&quot;: [
      {&quot;role&quot;: &quot;user&quot;, &quot;content&quot;: &quot;Explain the difference between a mutex and a semaphore in three sentences.&quot;}
    ]
  }&#39;

```

### Response

```json
{
  &quot;id&quot;: &quot;chatcmpl-abc123&quot;,
  &quot;object&quot;: &quot;chat.completion&quot;,
  &quot;model&quot;: &quot;claude-opus-4.8&quot;,
  &quot;choices&quot;: [
    {
      &quot;index&quot;: 0,
      &quot;message&quot;: {
        &quot;role&quot;: &quot;assistant&quot;,
        &quot;content&quot;: &quot;A mutex is a locking mechanism that allows only one thread to access a resource at a time...&quot;
      },
      &quot;finish_reason&quot;: &quot;stop&quot;
    }
  ],
  &quot;usage&quot;: {
    &quot;prompt_tokens&quot;: 24,
    &quot;completion_tokens&quot;: 87,
    &quot;total_tokens&quot;: 111
  }
}

```

## How it works

1. **Configura RunAPI** — Establece la variable de entorno RUNAPI_API_KEY. Si ya añadiste RunAPI como proveedor custom:runapi en Hermes Agent, la misma clave y base_url funcionan para Claude — cambia el parámetro model a claude-opus-4.8 en tu configuración de Hermes o usa el comando /model.
2. **Llama a Claude** — Envía una solicitud POST a /v1/chat/completions con model establecido en claude-opus-4.8. Incluye un array messages con al menos un mensaje de usuario. Establece max_tokens para controlar la longitud de la respuesta. Añade &quot;stream&quot; true para salida SSE token a token en tu sesión de Hermes.
3. **Lee la respuesta** — El endpoint devuelve el mensaje del asistente de forma síncrona — no se necesita polling de tareas. Hermes Agent muestra la respuesta en línea. Los recuentos de uso de tokens se incluyen en la respuesta para transparencia en la facturación. Las respuestas en streaming llegan como eventos SSE para visualización en tiempo real.

## Parameters

| Parameter | Type | Description |
|-----------|------|-------------|
| `model` | `string` | Obligatorio. claude-opus-4.8, claude-sonnet-4.6, claude-haiku-4.5 o cualquier variante de Claude listada en el catálogo de RunAPI. |
| `messages` | `array` | Obligatorio. Array de objetos de mensaje con campos role (system, user, assistant) y content. |
| `max_tokens` | `integer` | Número máximo de tokens en la respuesta. Los valores predeterminados varían por modelo — establécelo explícitamente para una facturación predecible. |
| `stream` | `boolean` | Cuando es true, devuelve server-sent events con deltas de tokens incrementales en vez de una sola respuesta JSON. |
| `temperature` | `float` | Temperatura de muestreo entre 0 y 1. Valores más bajos producen salidas más deterministas. |
| `top_p` | `float` | Corte de muestreo por núcleo. Alternativa a temperature — usa uno u otro, no ambos. |

## FAQ

### ¿Puedo llamar a Claude desde Hermes Agent a través de RunAPI?

Sí. Configura RunAPI como proveedor custom:runapi en Hermes Agent con base_url https://runapi.ai/v1 y api_mode chat_completions. Establece model en claude-opus-4.8 o cualquier otra variante de Claude. La misma RUNAPI_API_KEY gestiona chat, imagen, video y modelos de música.

### ¿Cómo se compara el precio de Claude en RunAPI con Anthropic directamente?

RunAPI cobra el 50% de la tarifa oficial por token de Anthropic. Opus 4.8 cuesta $7.50/$37.50 por millón de tokens de entrada/salida a través de RunAPI frente a $15/$75 directo. Sin suscripción ni compromiso de volumen.

### ¿Cambiar entre modelos de Claude requiere reconfigurar Hermes Agent?

No. Cambia solo el parámetro model en tu configuración de Hermes o usa el comando /model durante una sesión. El proveedor custom:runapi, base_url y clave API son los mismos para todas las variantes de Claude — Opus 4.8, Sonnet 4.6, Haiku 4.5 y snapshots con fecha.

### ¿Puedo usar la API nativa de mensajes de Anthropic desde Hermes Agent?

RunAPI expone tanto /v1/chat/completions (compatible con OpenAI, usado por el modo chat_completions de Hermes Agent) como /v1/messages (formato nativo de Anthropic). El endpoint nativo admite extended thinking y características específicas de Anthropic. Para Hermes Agent, la ruta compatible con OpenAI cubre chat estándar y streaming.

### ¿Qué modelo de Claude debería elegir para tareas de codificación en Hermes Agent?

Opus 4.8 para refactorizaciones complejas de múltiples archivos y decisiones de arquitectura. Sonnet 4.6 para codificación cotidiana — revisiones de pull requests, generación de tests y corrección de bugs. Haiku 4.5 para autocompletado rápido y sugerencias en línea donde la latencia importa más que la profundidad.


## Links

- [Guía de configuración de Hermes Agent →](https://runapi.ai/pt-BR/hermes-agent)
- [Modelos de Claude →](https://runapi.ai/pt-BR/models/claude)
- [Model catalog](https://runapi.ai/pt-BR/models)
- [API docs](https://runapi.ai/pt-BR/docs)