HERMES + GPT IMAGE

GPT Image in Hermes Agent verwenden.

GPT Image 2 ist OpenAIs dediziertes Bildgenerierungsmodell — Text-zu-Bild und anweisungsbasierte Bildbearbeitung mit bis zu 4K-Ausgabeauflösung und transparenter Hintergrundunterstützung. Hermes Agent ruft es über denselben RunAPI custom Provider und API-Key auf, der für Chat verwendet wird — kein ComfyUI oder GPU-Setup erforderlich.

ein API-Key · Text-to-Image + Bildbearbeitung · bis zu 4K-Ausgabe
Verwende RunAPI, um mit OpenAI GPT Image 2 aus Hermes Agent ein Bild zu generieren.


      Anforderungen:

      - Die RunAPI unter https://runapi.ai/v1/text_to_image nutzen.

      - API-Key aus der Umgebungsvariable RUNAPI_API_KEY lesen.

      - Den bereits in Hermes Agent konfigurierten custom:runapi Provider nutzen.

      - model auf "gpt-image-2-text-to-image" setzen.

      - Einen beschreibenden Prompt verfassen. GPT Image 2 folgt natürlichsprachlichen Anweisungen genau — Layout, Stil, Textoverlays und Transparenzbedarf beschreiben.

      - Optional output_resolution auf 1k, 2k oder 4k setzen. Standard ist 1k.

      - Die Antwort gibt eine task_id zurück. Den Task-Status-Endpunkt abfragen, bis der Task abgeschlossen ist, dann die Ausgabe-URL abrufen.

      
curl -X POST https://runapi.ai/v1/text_to_image \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2-text-to-image",
    "prompt": "A product photo of a glass perfume bottle on a marble surface, transparent background, studio lighting, the label reads AURORA in gold serif font",
    "output_resolution": "2k",
    "aspect_ratio": "3:4"
  }'
{
  "task_id": "tsk_abc123",
  "status": "pending",
  "model": "gpt-image-2-text-to-image"
}
Den curl-Befehl kopieren und testen gpt-image
SO FUNKTIONIERT ES

GPT Image in Hermes Agent in drei Schritten verwenden

1

RunAPI konfigurieren

Die Umgebungsvariable RUNAPI_API_KEY in der Shell-Konfiguration setzen. Wenn der custom:runapi Provider bereits in Hermes Agent für Chat konfiguriert ist, funktionieren derselbe Key und dieselbe base_url für GPT Image — kein zusätzliches Setup erforderlich.

export RUNAPI_API_KEY=runapi_xxx
2

GPT Image 2 aufrufen

Eine POST-Anfrage an den text_to_image-Endpunkt senden, model auf gpt-image-2-text-to-image setzen. Einen beschreibenden Prompt mit Layout- und Stilanweisungen angeben. output_resolution auf 2k oder 4k für höhere Detailschärfe setzen. Für die Bearbeitung bestehender Bilder den edit_image-Endpunkt mit gpt-image-2-image-to-image verwenden und source_image_urls angeben.

POST /v1/text_to_image
3

Ergebnis abrufen

Die API gibt sofort eine task_id zurück. Den Task-Status-Endpunkt abfragen, bis der Status auf completed wechselt, dann die Ausgabe-Bild-URL abrufen. GPT Image 2 ist typischerweise innerhalb von 10–30 Sekunden abgeschlossen, je nach Auflösung.

task_id: tsk_abc123
PARAMETER

GPT Image API-Parameter

Parameter Typ Beschreibung
model string Erforderlich. gpt-image-2-text-to-image für Generierung, gpt-image-2-image-to-image für Bearbeitung.
prompt string Erforderlich. Natürlichsprachliche Beschreibung des gewünschten Bildes. Unterstützt detaillierte Anweisungen zu Layout, Textoverlays und Stil.
output_resolution string Optional. Ausgabeauflösung — 1k (Standard), 2k oder 4k. Höhere Auflösung kostet mehr pro Bild.
aspect_ratio string Optional. Standard ist auto. Unterstützt 1:1, 3:2, 2:3, 4:3, 3:4, 16:9, 9:16 und mehr.
source_image_urls array Erforderlich für den edit_image-Endpunkt. Eine oder mehrere URLs von zu bearbeitenden Quellbildern.

Was ist GPT Image mit Hermes Agent?

GPT Image 2 behandelt Prompts als Produktions-Briefings statt als lose Schlüsselwortlisten. Es enthält einen Reasoning-Schritt vor der Generierung, der ihm hilft, strukturierten Anweisungen für Layout, Textplatzierung und Komposition zu folgen. Nutzer finden, dass es am besten mit einfacheren, klar strukturierten Prompts funktioniert – komplexe Multi-Pass-Verfeinerungen können Rausch-Muster einführen. Hermes Agent ruft es über den RunAPI-Custom-Provider auf.

GPT Image Anwendungsfälle

Produktfotografie mit transparenten Hintergründen

Produktshots auf transparenten Hintergründen für das Compositing in Marketingmaterialien, Kataloge oder E-Commerce-Listings ohne manuelles Masking generieren.

Social-Media-Kampagnen-Graphics

Social-Media-Visuals mit eingebettetem Text, Markenfarben und konsistentem Styling über mehrere Kampagnenbilder hinweg erstellen – den exakten Text im Prompt angeben.

Kinematische Stills für Video-Konvertierung

Video-bereite erste Frames und kinematische Stills generieren, die als Keyframes für Video-Generierungs-Workflows oder eigenständige redaktionelle Illustrationen dienen können.

FAQ

GPT Image + Hermes Agent — Fragen

Hermes Agent Grundeinrichtung

Noch nicht eingerichtet? Mit der RunAPI-Einrichtungsanleitung für Hermes Agent starten.

Hermes Agent Einrichtungsanleitung →

GPT Image Modellkatalog

Alle GPT Image-Varianten, Preise und API-Dokumentation ansehen.

GPT Image Modelle →

GPT Image in Hermes Agent heute ausprobieren.

Einen kostenlosen RunAPI-Key holen, den custom:runapi Provider konfigurieren und mit OpenAI GPT Image 2 Bilder in Hermes Agent generieren und bearbeiten.