---
title: &quot;Claude in Hermes Agent via RunAPI verwenden — LLM-API-Anleitung&quot;
url: &quot;https://runapi.ai/de/hermes-claude.md&quot;
canonical: &quot;https://runapi.ai/de/hermes-claude&quot;
locale: &quot;de&quot;
model: &quot;claude&quot;
---

# Claude in Hermes Agent verwenden.

Anthropic Claude bietet Opus 4.8 für maximale Leistung (200K Kontext, erweitertes Denken), Sonnet 4.6 für ausgewogene Performance und Haiku 4.5 für Geschwindigkeit. Hermes Agent ruft Claude über den custom:runapi-Provider zum halben offiziellen Anthropic-Token-Preis auf — derselbe Key und dieselbe base_url wie für Chat konfiguriert.

## API example

```bash
curl -X POST https://runapi.ai/v1/chat/completions \
  -H &quot;Authorization: Bearer $RUNAPI_API_KEY&quot; \
  -H &quot;Content-Type: application/json&quot; \
  -d &#39;{
    &quot;model&quot;: &quot;claude-opus-4.8&quot;,
    &quot;max_tokens&quot;: 1024,
    &quot;messages&quot;: [
      {&quot;role&quot;: &quot;user&quot;, &quot;content&quot;: &quot;Explain the difference between a mutex and a semaphore in three sentences.&quot;}
    ]
  }&#39;

```

### Response

```json
{
  &quot;id&quot;: &quot;chatcmpl-abc123&quot;,
  &quot;object&quot;: &quot;chat.completion&quot;,
  &quot;model&quot;: &quot;claude-opus-4.8&quot;,
  &quot;choices&quot;: [
    {
      &quot;index&quot;: 0,
      &quot;message&quot;: {
        &quot;role&quot;: &quot;assistant&quot;,
        &quot;content&quot;: &quot;A mutex is a locking mechanism that allows only one thread to access a resource at a time...&quot;
      },
      &quot;finish_reason&quot;: &quot;stop&quot;
    }
  ],
  &quot;usage&quot;: {
    &quot;prompt_tokens&quot;: 24,
    &quot;completion_tokens&quot;: 87,
    &quot;total_tokens&quot;: 111
  }
}

```

## How it works

1. **RunAPI konfigurieren** — Die RUNAPI_API_KEY-Umgebungsvariable setzen. Wenn RunAPI bereits als custom:runapi-Provider in Hermes Agent hinzugefügt wurde, funktionieren derselbe Key und dieselbe base_url für Claude — das model-Parameter in der Hermes-Konfiguration auf claude-opus-4.8 wechseln oder den /model-Befehl verwenden.
2. **Claude aufrufen** — Einen POST-Request an /v1/chat/completions mit model claude-opus-4.8 senden. Ein messages-Array mit mindestens einer User-Message einschließen. max_tokens setzen, um die Antwortlänge zu steuern. &quot;stream&quot; true für Token-für-Token-SSE-Output in der Hermes-Sitzung hinzufügen.
3. **Antwort auslesen** — Der Endpunkt gibt die Assistent-Message synchron zurück — kein Task-Polling nötig. Hermes Agent zeigt die Antwort direkt an. Token-Usage-Counts sind in der Antwort für Abrechnungstransparenz enthalten. Streaming-Antworten kommen als SSE-Events für Echtzeitanzeige.

## Parameters

| Parameter | Type | Description |
|-----------|------|-------------|
| `model` | `string` | Erforderlich. claude-opus-4.8, claude-sonnet-4.6, claude-haiku-4.5 oder eine andere Claude-Variante aus dem RunAPI-Katalog. |
| `messages` | `array` | Erforderlich. Array von Message-Objekten mit role (system, user, assistant) und content-Feldern. |
| `max_tokens` | `integer` | Maximale Anzahl von Token in der Antwort. Defaults variieren je nach Modell — für vorhersehbare Abrechnung explizit setzen. |
| `stream` | `boolean` | Wenn true, werden Server-Sent Events mit inkrementellen Token-Deltas statt einer einzelnen JSON-Antwort zurückgegeben. |
| `temperature` | `float` | Sampling-Temperatur zwischen 0 und 1. Niedrigere Werte liefern deterministischeren Output. |
| `top_p` | `float` | Nucleus-Sampling-Schwellenwert. Alternative zu temperature — nicht beide gleichzeitig verwenden. |

## FAQ

### Kann ich Claude aus Hermes Agent über RunAPI aufrufen?

Ja. RunAPI als custom:runapi-Provider in Hermes Agent mit base_url https://runapi.ai/v1 und api_mode chat_completions konfigurieren. Modell auf claude-opus-4.8 oder eine andere Claude-Variante setzen. Derselbe RUNAPI_API_KEY verwaltet Chat-, Bild-, Video- und Musikmodelle.

### Wie unterscheidet sich der RunAPI-Claude-Preis von Anthropic direkt?

RunAPI berechnet 50 % von Anthropics offiziellem Token-Preis. Opus 4.8 kostet 7,50 $/37,50 $ pro Million Input-/Output-Token über RunAPI gegenüber 15 $/75 $ direkt. Kein Abonnement oder Volumencommitment erforderlich.

### Erfordert das Wechseln zwischen Claude-Modellen eine Neukonfiguration von Hermes Agent?

Nein. Nur den model-Parameter in der Hermes-Konfiguration ändern oder den /model-Befehl während einer Sitzung verwenden. Der custom:runapi-Provider, die base_url und der API-Key bleiben über alle Claude-Varianten gleich — Opus 4.8, Sonnet 4.6, Haiku 4.5 und datierte Snapshots.

### Kann ich die native Anthropic Messages API von Hermes Agent verwenden?

RunAPI stellt sowohl /v1/chat/completions (OpenAI-kompatibel, vom Hermes Agent chat_completions-Modus verwendet) als auch /v1/messages (natives Anthropic-Format) bereit. Der native Endpunkt unterstützt erweitertes Denken und Anthropic-spezifische Funktionen. Für Hermes Agent deckt der OpenAI-kompatible Weg Standard-Chat und Streaming ab.

### Welches Claude-Modell sollte ich für Coding-Aufgaben in Hermes Agent wählen?

Opus 4.8 für komplexe Mehrfachdatei-Refactorings und Architekturentscheidungen. Sonnet 4.6 für alltägliches Coding — Pull-Request-Reviews, Testgenerierung und Bug-Fixes. Haiku 4.5 für schnelle Autovervollständigung und Inline-Vorschläge, wo Latenz wichtiger ist als Tiefe.


## Links

- [Hermes Agent Einrichtungsanleitung →](https://runapi.ai/de/hermes-agent)
- [Claude models →](https://runapi.ai/de/models/claude)
- [Model catalog](https://runapi.ai/de/models)
- [API docs](https://runapi.ai/de/docs)