HERMES + GPT

GPT in Hermes Agent verwenden.

GPT-5.5 ist OpenAIs Flagship-LLM, verfügbar über RunAPI zum halben offiziellen Token-Preis. Hermes Agent verbindet sich über den custom:runapi-Provider im chat_completions-Modus — ein Konfigurationsblock schaltet jede GPT-Variante (5.5, 5.4, 5.4-mini, 5.3-codex) mit Streaming, Function Calling und strukturiertem Output frei.

ein API-Key · OpenAI-kompatibel · Streaming-Antworten
RunAPI verwenden, um GPT-5.5 über den OpenAI-kompatiblen Chat-Completions-Endpunkt aufzurufen.


      Requirements:

      - Read the API key from RUNAPI_API_KEY.

      - Use the custom:runapi provider with base_url https://runapi.ai/v1.

      - Call POST https://runapi.ai/v1/chat/completions

      - Set model to "gpt-5.5".

      - Include a messages array with at least one user message.

      - The response is synchronous — the completion arrives in the same HTTP response.

      - For streaming, set "stream": true to receive server-sent events.

      - For the Responses API, call POST https://runapi.ai/v1/responses instead.

      
curl -X POST https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5.5",
    "messages": [
      {"role": "system", "content": "You are a concise coding assistant."},
      {"role": "user", "content": "Write a Python function that merges two sorted lists in O(n) time."}
    ],
    "temperature": 0.3,
    "max_tokens": 1024
  }'
{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "model": "gpt-5.5",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "def merge_sorted(a, b):\n    result = []\n    i = j = 0\n    while i < len(a) and j < len(b):\n        if a[i] <= b[j]:\n            result.append(a[i]); i += 1\n        else:\n            result.append(b[j]); j += 1\n    result.extend(a[i:])\n    result.extend(b[j:])\n    return result"
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 38,
    "completion_tokens": 95,
    "total_tokens": 133
  }
}
Den curl-Befehl kopieren und testen gpt
SO FUNKTIONIERT ES

GPT in Hermes Agent in drei Schritten verwenden

1

RunAPI als Custom-Provider hinzufügen

Wenn der custom:runapi-Provider bereits in Hermes Agent konfiguriert ist, funktionieren derselbe Key und dieselbe /v1-Base-URL für GPT. Andernfalls einen Custom-Provider mit base_url https://runapi.ai/v1, key_env RUNAPI_API_KEY und api_mode chat_completions hinzufügen.

export RUNAPI_API_KEY=runapi_xxx
2

Ein GPT-Modell auswählen

Das Standardmodell auf gpt-5.5 für das Flaggschiff, gpt-5.4 oder gpt-5.4-mini für geringere Kosten oder gpt-5.3-codex für code-intensive Aufgaben setzen. Der /v1/chat/completions-Endpunkt gibt eine Standard-OpenAI-Antwort mit Usage-Counts und finish_reason zurück.

default: gpt-5.5
3

Streaming oder Function Calling verwenden

Hermes Agent leitet stream-, tools- und response_format-Parameter über den custom:runapi-Provider weiter. Alle Standard-OpenAI-Chat-Completions-Parameter funktionieren über RunAPI ohne Änderungen.

"stream": true
PARAMETER

GPT Chat-Completions-Parameter

Parameter Typ Beschreibung
model string Erforderlich. gpt-5.5, gpt-5.4, gpt-5.4-mini, gpt-5.4-nano, gpt-5.3-codex oder gpt-5.2.
messages array Erforderlich. Array von Message-Objekten mit role (system, user, assistant) und content-Feldern.
temperature number Optional. Sampling-Temperatur zwischen 0 und 2. Niedrigere Werte liefern deterministischeren Output. Standard 1.
max_tokens integer Optional. Maximale Anzahl zu generierender Token in der Antwort.
stream boolean Optional. Wenn true, werden Server-Sent Events mit inkrementellen Token-Deltas zurückgegeben. Standard false.
tools array Optional. Array von Tool-Definitionen für Function Calling. Jedes Tool hat type, function name, description und parameters schema.
response_format object Optional. type auf "json_object" oder "json_schema" für strukturierten JSON-Output setzen.
reasoning_effort string Optional. Steuert die Denktiefe für unterstützte Modelle. Akzeptierte Werte sind low, medium, high.

Was ist GPT mit Hermes Agent?

GPT ist OpenAIs LLM-Familie, verfügbar über RunAPIs custom:runapi-Provider zum halben offiziellen Token-Preis. Hermes Agent verbindet sich über den Standard-chat_completions-API-Modus, sodass man GPT-5.5, 5.4, 5.4-mini und 5.3-codex mit Streaming, Function-Calling, strukturierter JSON-Ausgabe und Vision-Eingabe erhält – alles über dieselbe Provider-Konfiguration, die für Claude oder Gemini verwendet wird.

GPT Anwendungsfälle

Agentisches Coding mit Codex-Modellen

GPT-5.3-codex über Hermes Agent für Code-Generierung, Refactoring und automatisierte PR-Workflows zu niedrigeren Token-Kosten als die Flaggschiff-Modelle verwenden.

Stapelverarbeitung mit strukturierten Ausgaben

Große Dokumentensets mit json_schema-Response-Format durch GPT verarbeiten und strukturierte Daten für RAG-Pipelines, Rechnungs-Parsing oder Content-Klassifizierung in großem Maßstab extrahieren.

Dynamisches Modell-Routing nach Aufgabenkomplexität

Einfache Anfragen zur Kosteneffizienz an GPT-5.4-mini und komplexe Reasoning-Aufgaben für Qualität an GPT-5.5 weiterleiten – alles über denselben custom:runapi-Provider und API-Key.

FAQ

GPT + Hermes Agent — Fragen

Hermes Agent Grundeinrichtung

Noch nicht eingerichtet? Mit der RunAPI-Einrichtungsanleitung für Hermes Agent starten.

Hermes Agent Einrichtungsanleitung →

GPT Modellkatalog

Alle GPT-Varianten, Token-Preise und API-Dokumentation ansehen.

GPT on RunAPI →

GPT-5.5 in Hermes Agent noch heute ausprobieren.

Einen kostenlosen RunAPI-Key holen, den custom:runapi-Provider konfigurieren und GPT-5.5 zum halben offiziellen OpenAI-Token-Preis aufrufen — Streaming, Function Calling und strukturierter Output inklusive.