Kann ich GPT-5.5 in Hermes Agent über RunAPI verwenden?

Ja. Hermes Agent unterstützt benutzerdefinierte OpenAI-kompatible Provider. RunAPI als custom:runapi mit base_url https://runapi.ai/v1, key_env RUNAPI_API_KEY und api_mode chat_completions hinzufügen. Das Standardmodell auf gpt-5.5 setzen.

Wie unterscheidet sich der GPT-Preis auf RunAPI vom offiziellen OpenAI-Preis?

RunAPI berechnet 50 % des offiziellen OpenAI-Token-Preises für alle GPT-Modelle. Der Rabatt gilt für Input- und Output-Token. Aktuelle Preise pro Million Token auf der RunAPI-Preisseite.

Kann ich zwischen GPT-Varianten wechseln, ohne die Provider-Konfiguration zu ändern?

Ja. Der custom:runapi-Provider funktioniert mit allen GPT-Varianten. Nur das model-Feld im Request ändern — gpt-5.5, gpt-5.4, gpt-5.4-mini oder gpt-5.3-codex. Base URL, API-Key und api_mode bleiben gleich.

Funktioniert die Responses API über RunAPI in Hermes Agent?

Ja. RunAPI leitet auch die OpenAI Responses API unter /v1/responses weiter. Wenn Hermes Agent die Responses-API-Oberfläche unterstützt, den Endpunkt auf https://runapi.ai/v1/responses setzen. Derselbe API-Key und Custom-Provider funktionieren für beide Endpunkte.

Kann ich Function Calling und strukturierten Output mit GPT auf RunAPI verwenden?

Ja. Ein tools-Array für Function Calling übergeben oder response_format auf json_schema für strukturierten Output setzen. RunAPI leitet diese Parameter an das GPT-Modell weiter und gibt tool_calls oder strukturiertes JSON im OpenAI-Standardformat zurück.

HERMES + GPT

GPT in Hermes Agent verwenden.

GPT-5.5 ist OpenAIs Flagship-LLM, verfügbar über RunAPI zum halben offiziellen Token-Preis. Hermes Agent verbindet sich über den custom:runapi-Provider im chat_completions-Modus — ein Konfigurationsblock schaltet jede GPT-Variante (5.5, 5.4, 5.4-mini, 5.3-codex) mit Streaming, Function Calling und strukturiertem Output frei.

API Key holen Dokumentation lesen

ein API-Key · OpenAI-kompatibel · Streaming-Antworten

RunAPI verwenden, um GPT-5.5 über den OpenAI-kompatiblen Chat-Completions-Endpunkt aufzurufen.


      Requirements:

      - Read the API key from RUNAPI_API_KEY.

      - Use the custom:runapi provider with base_url https://runapi.ai/v1.

      - Call POST https://runapi.ai/v1/chat/completions

      - Set model to "gpt-5.5".

      - Include a messages array with at least one user message.

      - The response is synchronous — the completion arrives in the same HTTP response.

      - For streaming, set "stream": true to receive server-sent events.

      - For the Responses API, call POST https://runapi.ai/v1/responses instead.

curl -X POST https://runapi.ai/v1/chat/completions \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5.5",
    "messages": [
      {"role": "system", "content": "You are a concise coding assistant."},
      {"role": "user", "content": "Write a Python function that merges two sorted lists in O(n) time."}
    ],
    "temperature": 0.3,
    "max_tokens": 1024
  }'

{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "model": "gpt-5.5",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "def merge_sorted(a, b):\n    result = []\n    i = j = 0\n    while i < len(a) and j < len(b):\n        if a[i] <= b[j]:\n            result.append(a[i]); i += 1\n        else:\n            result.append(b[j]); j += 1\n    result.extend(a[i:])\n    result.extend(b[j:])\n    return result"
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 38,
    "completion_tokens": 95,
    "total_tokens": 133
  }
}

Den curl-Befehl kopieren und testen gpt

SO FUNKTIONIERT ES

GPT in Hermes Agent in drei Schritten verwenden

RunAPI als Custom-Provider hinzufügen

Wenn der custom:runapi-Provider bereits in Hermes Agent konfiguriert ist, funktionieren derselbe Key und dieselbe /v1-Base-URL für GPT. Andernfalls einen Custom-Provider mit base_url https://runapi.ai/v1, key_env RUNAPI_API_KEY und api_mode chat_completions hinzufügen.

export RUNAPI_API_KEY=runapi_xxx

Ein GPT-Modell auswählen

Das Standardmodell auf gpt-5.5 für das Flaggschiff, gpt-5.4 oder gpt-5.4-mini für geringere Kosten oder gpt-5.3-codex für code-intensive Aufgaben setzen. Der /v1/chat/completions-Endpunkt gibt eine Standard-OpenAI-Antwort mit Usage-Counts und finish_reason zurück.

default: gpt-5.5

Streaming oder Function Calling verwenden

Hermes Agent leitet stream-, tools- und response_format-Parameter über den custom:runapi-Provider weiter. Alle Standard-OpenAI-Chat-Completions-Parameter funktionieren über RunAPI ohne Änderungen.

"stream": true

PARAMETER

GPT Chat-Completions-Parameter

Parameter	Typ	Beschreibung
`model`	`string`	Erforderlich. gpt-5.5, gpt-5.4, gpt-5.4-mini, gpt-5.4-nano, gpt-5.3-codex oder gpt-5.2.
`messages`	`array`	Erforderlich. Array von Message-Objekten mit role (system, user, assistant) und content-Feldern.
`temperature`	`number`	Optional. Sampling-Temperatur zwischen 0 und 2. Niedrigere Werte liefern deterministischeren Output. Standard 1.
`max_tokens`	`integer`	Optional. Maximale Anzahl zu generierender Token in der Antwort.
`stream`	`boolean`	Optional. Wenn true, werden Server-Sent Events mit inkrementellen Token-Deltas zurückgegeben. Standard false.
`tools`	`array`	Optional. Array von Tool-Definitionen für Function Calling. Jedes Tool hat type, function name, description und parameters schema.
`response_format`	`object`	Optional. type auf "json_object" oder "json_schema" für strukturierten JSON-Output setzen.
`reasoning_effort`	`string`	Optional. Steuert die Denktiefe für unterstützte Modelle. Akzeptierte Werte sind low, medium, high.

Was ist GPT mit Hermes Agent?

GPT ist OpenAIs LLM-Familie, verfügbar über RunAPIs custom:runapi-Provider zum halben offiziellen Token-Preis. Hermes Agent verbindet sich über den Standard-chat_completions-API-Modus, sodass man GPT-5.5, 5.4, 5.4-mini und 5.3-codex mit Streaming, Function-Calling, strukturierter JSON-Ausgabe und Vision-Eingabe erhält – alles über dieselbe Provider-Konfiguration, die für Claude oder Gemini verwendet wird.

GPT Anwendungsfälle

Agentisches Coding mit Codex-Modellen

GPT-5.3-codex über Hermes Agent für Code-Generierung, Refactoring und automatisierte PR-Workflows zu niedrigeren Token-Kosten als die Flaggschiff-Modelle verwenden.

Stapelverarbeitung mit strukturierten Ausgaben

Große Dokumentensets mit json_schema-Response-Format durch GPT verarbeiten und strukturierte Daten für RAG-Pipelines, Rechnungs-Parsing oder Content-Klassifizierung in großem Maßstab extrahieren.

Dynamisches Modell-Routing nach Aufgabenkomplexität

Einfache Anfragen zur Kosteneffizienz an GPT-5.4-mini und komplexe Reasoning-Aufgaben für Qualität an GPT-5.5 weiterleiten – alles über denselben custom:runapi-Provider und API-Key.

FAQ

GPT + Hermes Agent — Fragen

Hermes Agent Grundeinrichtung

Noch nicht eingerichtet? Mit der RunAPI-Einrichtungsanleitung für Hermes Agent starten.

Hermes Agent Einrichtungsanleitung →

GPT Modellkatalog

Alle GPT-Varianten, Token-Preise und API-Dokumentation ansehen.

GPT on RunAPI →

GPT-5.5 in Hermes Agent noch heute ausprobieren.

Einen kostenlosen RunAPI-Key holen, den custom:runapi-Provider konfigurieren und GPT-5.5 zum halben offiziellen OpenAI-Token-Preis aufrufen — Streaming, Function Calling und strukturierter Output inklusive.

Modelle durchsuchen →