HERMES + CLAUDE

Claude in Hermes Agent verwenden.

Anthropic Claude bietet Opus 4.8 für maximale Leistung (200K Kontext, erweitertes Denken), Sonnet 4.6 für ausgewogene Performance und Haiku 4.5 für Geschwindigkeit. Hermes Agent ruft Claude über den custom:runapi-Provider zum halben offiziellen Anthropic-Token-Preis auf — derselbe Key und dieselbe base_url wie für Chat konfiguriert.

ein API-Key · OpenAI-kompatibler Endpunkt · Token-Abrechnung zu 50% Rabatt
RunAPI verwenden, um eine Claude-Chat-Completion-Anfrage über Hermes Agent zu senden.


      Requirements:

      - Use the custom:runapi provider already configured in Hermes Agent

      - Call the RunAPI chat completions endpoint at https://runapi.ai/v1/chat/completions

      - Set model to "claude-opus-4.8"

      - The RUNAPI_API_KEY environment variable provides authorization

      - The response is synchronous — the assistant message is returned directly in the response body

      - For streaming, set "stream": true to receive server-sent events

      
curl -X POST https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "claude-opus-4.8",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "Explain the difference between a mutex and a semaphore in three sentences."}
    ]
  }'
{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "model": "claude-opus-4.8",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "A mutex is a locking mechanism that allows only one thread to access a resource at a time..."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 24,
    "completion_tokens": 87,
    "total_tokens": 111
  }
}
Den curl-Befehl kopieren und testen claude
SO FUNKTIONIERT ES

Claude in Hermes Agent in drei Schritten verwenden

1

RunAPI konfigurieren

Die RUNAPI_API_KEY-Umgebungsvariable setzen. Wenn RunAPI bereits als custom:runapi-Provider in Hermes Agent hinzugefügt wurde, funktionieren derselbe Key und dieselbe base_url für Claude — das model-Parameter in der Hermes-Konfiguration auf claude-opus-4.8 wechseln oder den /model-Befehl verwenden.

export RUNAPI_API_KEY=runapi_xxx
2

Claude aufrufen

Einen POST-Request an /v1/chat/completions mit model claude-opus-4.8 senden. Ein messages-Array mit mindestens einer User-Message einschließen. max_tokens setzen, um die Antwortlänge zu steuern. "stream" true für Token-für-Token-SSE-Output in der Hermes-Sitzung hinzufügen.

POST /v1/chat/completions
3

Antwort auslesen

Der Endpunkt gibt die Assistent-Message synchron zurück — kein Task-Polling nötig. Hermes Agent zeigt die Antwort direkt an. Token-Usage-Counts sind in der Antwort für Abrechnungstransparenz enthalten. Streaming-Antworten kommen als SSE-Events für Echtzeitanzeige.

usage.total_tokens: 111
PARAMETER

Claude API-Parameter (OpenAI-kompatibel)

Parameter Typ Beschreibung
model string Erforderlich. claude-opus-4.8, claude-sonnet-4.6, claude-haiku-4.5 oder eine andere Claude-Variante aus dem RunAPI-Katalog.
messages array Erforderlich. Array von Message-Objekten mit role (system, user, assistant) und content-Feldern.
max_tokens integer Maximale Anzahl von Token in der Antwort. Defaults variieren je nach Modell — für vorhersehbare Abrechnung explizit setzen.
stream boolean Wenn true, werden Server-Sent Events mit inkrementellen Token-Deltas statt einer einzelnen JSON-Antwort zurückgegeben.
temperature float Sampling-Temperatur zwischen 0 und 1. Niedrigere Werte liefern deterministischeren Output.
top_p float Nucleus-Sampling-Schwellenwert. Alternative zu temperature — nicht beide gleichzeitig verwenden.

Was ist Claude mit Hermes Agent?

Claude ist Anthropics LLM und Hermes Agent ruft es über den custom:runapi-Provider zum halben offiziellen Anthropic-Token-Preis auf. Die drei Stufen – Opus 4.8 (200K-Kontext, erweitertes Denken), Sonnet 4.6 (ausgewogene Geschwindigkeit und Qualität) und Haiku 4.5 (schnell und günstig) – funktionieren alle über dieselbe Provider-Konfiguration. Pro Anfrage zwischen ihnen wechseln, indem nur das Modell-Feld geändert wird, ohne Neukonfiguration.

Claude Anwendungsfälle

KI-Agenten mit Tool-Nutzung und MCP aufbauen

Claudes Function-Calling und Model-Context-Protocol-Unterstützung in Hermes Agent verwenden, um mehrstufige automatisierte Workflows zu bauen, die Dateien lesen, Datenbanken abfragen und auf Basis von Reasoning Aktionen ausführen.

Code-Generierung und -Review

Coding-Aufgaben durch Claude in Hermes Agent leiten – Opus 4.8 für komplexe Architekturentscheidungen und Multi-Datei-Refactors, Sonnet 4.6 für alltägliche Pull-Request-Reviews und Test-Generierung.

Content-Generierung mit Prompt-Caching

Marketing-Texte, Dokumentation oder Berichte in großem Maßstab mit Prompt-Caching generieren, um Kosten zu reduzieren, wenn System-Prompt und Kontext über viele Anfragen gleich bleiben.

FAQ

Claude + Hermes Agent — Fragen

Hermes Agent Grundeinrichtung

Noch nicht eingerichtet? Mit der RunAPI-Einrichtungsanleitung für Hermes Agent starten.

Hermes Agent Einrichtungsanleitung →

Claude Modellkatalog

Alle Claude-Varianten, Token-Preise und Kontextfenster-Details ansehen.

Claude models →

Claude in Hermes Agent noch heute ausprobieren.

Einen kostenlosen RunAPI-Key holen, den custom:runapi-Provider konfigurieren und Claude zum halben offiziellen Anthropic-Preis verwenden.