Kann ich Claude aus Hermes Agent über RunAPI aufrufen?

Ja. RunAPI als custom:runapi-Provider in Hermes Agent mit base_url https://runapi.ai/v1 und api_mode chat_completions konfigurieren. Modell auf claude-opus-4.8 oder eine andere Claude-Variante setzen. Derselbe RUNAPI_API_KEY verwaltet Chat-, Bild-, Video- und Musikmodelle.

Wie unterscheidet sich der RunAPI-Claude-Preis von Anthropic direkt?

RunAPI berechnet 50 % von Anthropics offiziellem Token-Preis. Opus 4.8 kostet 7,50 $/37,50 $ pro Million Input-/Output-Token über RunAPI gegenüber 15 $/75 $ direkt. Kein Abonnement oder Volumencommitment erforderlich.

Erfordert das Wechseln zwischen Claude-Modellen eine Neukonfiguration von Hermes Agent?

Nein. Nur den model-Parameter in der Hermes-Konfiguration ändern oder den /model-Befehl während einer Sitzung verwenden. Der custom:runapi-Provider, die base_url und der API-Key bleiben über alle Claude-Varianten gleich — Opus 4.8, Sonnet 4.6, Haiku 4.5 und datierte Snapshots.

Kann ich die native Anthropic Messages API von Hermes Agent verwenden?

RunAPI stellt sowohl /v1/chat/completions (OpenAI-kompatibel, vom Hermes Agent chat_completions-Modus verwendet) als auch /v1/messages (natives Anthropic-Format) bereit. Der native Endpunkt unterstützt erweitertes Denken und Anthropic-spezifische Funktionen. Für Hermes Agent deckt der OpenAI-kompatible Weg Standard-Chat und Streaming ab.

Welches Claude-Modell sollte ich für Coding-Aufgaben in Hermes Agent wählen?

Opus 4.8 für komplexe Mehrfachdatei-Refactorings und Architekturentscheidungen. Sonnet 4.6 für alltägliches Coding — Pull-Request-Reviews, Testgenerierung und Bug-Fixes. Haiku 4.5 für schnelle Autovervollständigung und Inline-Vorschläge, wo Latenz wichtiger ist als Tiefe.

HERMES + CLAUDE

Claude in Hermes Agent verwenden.

Anthropic Claude bietet Opus 4.8 für maximale Leistung (200K Kontext, erweitertes Denken), Sonnet 4.6 für ausgewogene Performance und Haiku 4.5 für Geschwindigkeit. Hermes Agent ruft Claude über den custom:runapi-Provider zum halben offiziellen Anthropic-Token-Preis auf — derselbe Key und dieselbe base_url wie für Chat konfiguriert.

API Key holen Dokumentation lesen

ein API-Key · OpenAI-kompatibler Endpunkt · Token-Abrechnung zu 50% Rabatt

RunAPI verwenden, um eine Claude-Chat-Completion-Anfrage über Hermes Agent zu senden.


      Requirements:

      - Use the custom:runapi provider already configured in Hermes Agent

      - Call the RunAPI chat completions endpoint at https://runapi.ai/v1/chat/completions

      - Set model to "claude-opus-4.8"

      - The RUNAPI_API_KEY environment variable provides authorization

      - The response is synchronous — the assistant message is returned directly in the response body

      - For streaming, set "stream": true to receive server-sent events

curl -X POST https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "claude-opus-4.8",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "Explain the difference between a mutex and a semaphore in three sentences."}
    ]
  }'

{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "model": "claude-opus-4.8",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "A mutex is a locking mechanism that allows only one thread to access a resource at a time..."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 24,
    "completion_tokens": 87,
    "total_tokens": 111
  }
}

Den curl-Befehl kopieren und testen claude

SO FUNKTIONIERT ES

Claude in Hermes Agent in drei Schritten verwenden

RunAPI konfigurieren

Die RUNAPI_API_KEY-Umgebungsvariable setzen. Wenn RunAPI bereits als custom:runapi-Provider in Hermes Agent hinzugefügt wurde, funktionieren derselbe Key und dieselbe base_url für Claude — das model-Parameter in der Hermes-Konfiguration auf claude-opus-4.8 wechseln oder den /model-Befehl verwenden.

export RUNAPI_API_KEY=runapi_xxx

Claude aufrufen

Einen POST-Request an /v1/chat/completions mit model claude-opus-4.8 senden. Ein messages-Array mit mindestens einer User-Message einschließen. max_tokens setzen, um die Antwortlänge zu steuern. "stream" true für Token-für-Token-SSE-Output in der Hermes-Sitzung hinzufügen.

POST /v1/chat/completions

Antwort auslesen

Der Endpunkt gibt die Assistent-Message synchron zurück — kein Task-Polling nötig. Hermes Agent zeigt die Antwort direkt an. Token-Usage-Counts sind in der Antwort für Abrechnungstransparenz enthalten. Streaming-Antworten kommen als SSE-Events für Echtzeitanzeige.

usage.total_tokens: 111

PARAMETER

Claude API-Parameter (OpenAI-kompatibel)

Parameter	Typ	Beschreibung
`model`	`string`	Erforderlich. claude-opus-4.8, claude-sonnet-4.6, claude-haiku-4.5 oder eine andere Claude-Variante aus dem RunAPI-Katalog.
`messages`	`array`	Erforderlich. Array von Message-Objekten mit role (system, user, assistant) und content-Feldern.
`max_tokens`	`integer`	Maximale Anzahl von Token in der Antwort. Defaults variieren je nach Modell — für vorhersehbare Abrechnung explizit setzen.
`stream`	`boolean`	Wenn true, werden Server-Sent Events mit inkrementellen Token-Deltas statt einer einzelnen JSON-Antwort zurückgegeben.
`temperature`	`float`	Sampling-Temperatur zwischen 0 und 1. Niedrigere Werte liefern deterministischeren Output.
`top_p`	`float`	Nucleus-Sampling-Schwellenwert. Alternative zu temperature — nicht beide gleichzeitig verwenden.

Was ist Claude mit Hermes Agent?

Claude ist Anthropics LLM und Hermes Agent ruft es über den custom:runapi-Provider zum halben offiziellen Anthropic-Token-Preis auf. Die drei Stufen – Opus 4.8 (200K-Kontext, erweitertes Denken), Sonnet 4.6 (ausgewogene Geschwindigkeit und Qualität) und Haiku 4.5 (schnell und günstig) – funktionieren alle über dieselbe Provider-Konfiguration. Pro Anfrage zwischen ihnen wechseln, indem nur das Modell-Feld geändert wird, ohne Neukonfiguration.

Claude Anwendungsfälle

KI-Agenten mit Tool-Nutzung und MCP aufbauen

Claudes Function-Calling und Model-Context-Protocol-Unterstützung in Hermes Agent verwenden, um mehrstufige automatisierte Workflows zu bauen, die Dateien lesen, Datenbanken abfragen und auf Basis von Reasoning Aktionen ausführen.

Code-Generierung und -Review

Coding-Aufgaben durch Claude in Hermes Agent leiten – Opus 4.8 für komplexe Architekturentscheidungen und Multi-Datei-Refactors, Sonnet 4.6 für alltägliche Pull-Request-Reviews und Test-Generierung.

Content-Generierung mit Prompt-Caching

Marketing-Texte, Dokumentation oder Berichte in großem Maßstab mit Prompt-Caching generieren, um Kosten zu reduzieren, wenn System-Prompt und Kontext über viele Anfragen gleich bleiben.

FAQ

Claude + Hermes Agent — Fragen

Hermes Agent Grundeinrichtung

Noch nicht eingerichtet? Mit der RunAPI-Einrichtungsanleitung für Hermes Agent starten.

Hermes Agent Einrichtungsanleitung →

Claude Modellkatalog

Alle Claude-Varianten, Token-Preise und Kontextfenster-Details ansehen.

Claude models →

Claude in Hermes Agent noch heute ausprobieren.

Einen kostenlosen RunAPI-Key holen, den custom:runapi-Provider konfigurieren und Claude zum halben offiziellen Anthropic-Preis verwenden.

Modelle durchsuchen →