Claude in Hermes Agent verwenden.
Anthropic Claude bietet Opus 4.8 für maximale Leistung (200K Kontext, erweitertes Denken), Sonnet 4.6 für ausgewogene Performance und Haiku 4.5 für Geschwindigkeit. Hermes Agent ruft Claude über den custom:runapi-Provider zum halben offiziellen Anthropic-Token-Preis auf — derselbe Key und dieselbe base_url wie für Chat konfiguriert.
RunAPI verwenden, um eine Claude-Chat-Completion-Anfrage über Hermes Agent zu senden.
Requirements:
- Use the custom:runapi provider already configured in Hermes Agent
- Call the RunAPI chat completions endpoint at https://runapi.ai/v1/chat/completions
- Set model to "claude-opus-4.8"
- The RUNAPI_API_KEY environment variable provides authorization
- The response is synchronous — the assistant message is returned directly in the response body
- For streaming, set "stream": true to receive server-sent events
curl -X POST https://runapi.ai/v1/chat/completions \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "claude-opus-4.8",
"max_tokens": 1024,
"messages": [
{"role": "user", "content": "Explain the difference between a mutex and a semaphore in three sentences."}
]
}'
{
"id": "chatcmpl-abc123",
"object": "chat.completion",
"model": "claude-opus-4.8",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "A mutex is a locking mechanism that allows only one thread to access a resource at a time..."
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 24,
"completion_tokens": 87,
"total_tokens": 111
}
}
Claude in Hermes Agent in drei Schritten verwenden
RunAPI konfigurieren
Die RUNAPI_API_KEY-Umgebungsvariable setzen. Wenn RunAPI bereits als custom:runapi-Provider in Hermes Agent hinzugefügt wurde, funktionieren derselbe Key und dieselbe base_url für Claude — das model-Parameter in der Hermes-Konfiguration auf claude-opus-4.8 wechseln oder den /model-Befehl verwenden.
export RUNAPI_API_KEY=runapi_xxx
Claude aufrufen
Einen POST-Request an /v1/chat/completions mit model claude-opus-4.8 senden. Ein messages-Array mit mindestens einer User-Message einschließen. max_tokens setzen, um die Antwortlänge zu steuern. "stream" true für Token-für-Token-SSE-Output in der Hermes-Sitzung hinzufügen.
POST /v1/chat/completions
Antwort auslesen
Der Endpunkt gibt die Assistent-Message synchron zurück — kein Task-Polling nötig. Hermes Agent zeigt die Antwort direkt an. Token-Usage-Counts sind in der Antwort für Abrechnungstransparenz enthalten. Streaming-Antworten kommen als SSE-Events für Echtzeitanzeige.
usage.total_tokens: 111
Claude API-Parameter (OpenAI-kompatibel)
| Parameter | Typ | Beschreibung |
|---|---|---|
model |
string |
Erforderlich. claude-opus-4.8, claude-sonnet-4.6, claude-haiku-4.5 oder eine andere Claude-Variante aus dem RunAPI-Katalog. |
messages |
array |
Erforderlich. Array von Message-Objekten mit role (system, user, assistant) und content-Feldern. |
max_tokens |
integer |
Maximale Anzahl von Token in der Antwort. Defaults variieren je nach Modell — für vorhersehbare Abrechnung explizit setzen. |
stream |
boolean |
Wenn true, werden Server-Sent Events mit inkrementellen Token-Deltas statt einer einzelnen JSON-Antwort zurückgegeben. |
temperature |
float |
Sampling-Temperatur zwischen 0 und 1. Niedrigere Werte liefern deterministischeren Output. |
top_p |
float |
Nucleus-Sampling-Schwellenwert. Alternative zu temperature — nicht beide gleichzeitig verwenden. |
Was ist Claude mit Hermes Agent?
Claude ist Anthropics LLM und Hermes Agent ruft es über den custom:runapi-Provider zum halben offiziellen Anthropic-Token-Preis auf. Die drei Stufen – Opus 4.8 (200K-Kontext, erweitertes Denken), Sonnet 4.6 (ausgewogene Geschwindigkeit und Qualität) und Haiku 4.5 (schnell und günstig) – funktionieren alle über dieselbe Provider-Konfiguration. Pro Anfrage zwischen ihnen wechseln, indem nur das Modell-Feld geändert wird, ohne Neukonfiguration.
Claude Anwendungsfälle
KI-Agenten mit Tool-Nutzung und MCP aufbauen
Claudes Function-Calling und Model-Context-Protocol-Unterstützung in Hermes Agent verwenden, um mehrstufige automatisierte Workflows zu bauen, die Dateien lesen, Datenbanken abfragen und auf Basis von Reasoning Aktionen ausführen.
Code-Generierung und -Review
Coding-Aufgaben durch Claude in Hermes Agent leiten – Opus 4.8 für komplexe Architekturentscheidungen und Multi-Datei-Refactors, Sonnet 4.6 für alltägliche Pull-Request-Reviews und Test-Generierung.
Content-Generierung mit Prompt-Caching
Marketing-Texte, Dokumentation oder Berichte in großem Maßstab mit Prompt-Caching generieren, um Kosten zu reduzieren, wenn System-Prompt und Kontext über viele Anfragen gleich bleiben.
Claude + Hermes Agent — Fragen
Ja. RunAPI als custom:runapi-Provider in Hermes Agent mit base_url https://runapi.ai/v1 und api_mode chat_completions konfigurieren. Modell auf claude-opus-4.8 oder eine andere Claude-Variante setzen. Derselbe RUNAPI_API_KEY verwaltet Chat-, Bild-, Video- und Musikmodelle.
RunAPI berechnet 50 % von Anthropics offiziellem Token-Preis. Opus 4.8 kostet 7,50 $/37,50 $ pro Million Input-/Output-Token über RunAPI gegenüber 15 $/75 $ direkt. Kein Abonnement oder Volumencommitment erforderlich.
Nein. Nur den model-Parameter in der Hermes-Konfiguration ändern oder den /model-Befehl während einer Sitzung verwenden. Der custom:runapi-Provider, die base_url und der API-Key bleiben über alle Claude-Varianten gleich — Opus 4.8, Sonnet 4.6, Haiku 4.5 und datierte Snapshots.
RunAPI stellt sowohl /v1/chat/completions (OpenAI-kompatibel, vom Hermes Agent chat_completions-Modus verwendet) als auch /v1/messages (natives Anthropic-Format) bereit. Der native Endpunkt unterstützt erweitertes Denken und Anthropic-spezifische Funktionen. Für Hermes Agent deckt der OpenAI-kompatible Weg Standard-Chat und Streaming ab.
Opus 4.8 für komplexe Mehrfachdatei-Refactorings und Architekturentscheidungen. Sonnet 4.6 für alltägliches Coding — Pull-Request-Reviews, Testgenerierung und Bug-Fixes. Haiku 4.5 für schnelle Autovervollständigung und Inline-Vorschläge, wo Latenz wichtiger ist als Tiefe.
Hermes Agent Grundeinrichtung
Noch nicht eingerichtet? Mit der RunAPI-Einrichtungsanleitung für Hermes Agent starten.
Hermes Agent Einrichtungsanleitung →Claude Modellkatalog
Alle Claude-Varianten, Token-Preise und Kontextfenster-Details ansehen.
Claude models →Claude in Hermes Agent noch heute ausprobieren.
Einen kostenlosen RunAPI-Key holen, den custom:runapi-Provider konfigurieren und Claude zum halben offiziellen Anthropic-Preis verwenden.