GPT Image in Hermes Agent verwenden.
GPT Image 2 ist OpenAIs dediziertes Bildgenerierungsmodell — Text-zu-Bild und anweisungsbasierte Bildbearbeitung mit bis zu 4K-Ausgabeauflösung und transparenter Hintergrundunterstützung. Hermes Agent ruft es über denselben RunAPI custom Provider und API-Key auf, der für Chat verwendet wird — kein ComfyUI oder GPU-Setup erforderlich.
Verwende RunAPI, um mit OpenAI GPT Image 2 aus Hermes Agent ein Bild zu generieren.
Anforderungen:
- Die RunAPI unter https://runapi.ai/v1/text_to_image nutzen.
- API-Key aus der Umgebungsvariable RUNAPI_API_KEY lesen.
- Den bereits in Hermes Agent konfigurierten custom:runapi Provider nutzen.
- model auf "gpt-image-2-text-to-image" setzen.
- Einen beschreibenden Prompt verfassen. GPT Image 2 folgt natürlichsprachlichen Anweisungen genau — Layout, Stil, Textoverlays und Transparenzbedarf beschreiben.
- Optional output_resolution auf 1k, 2k oder 4k setzen. Standard ist 1k.
- Die Antwort gibt eine task_id zurück. Den Task-Status-Endpunkt abfragen, bis der Task abgeschlossen ist, dann die Ausgabe-URL abrufen.
curl -X POST https://runapi.ai/v1/text_to_image \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-image-2-text-to-image",
"prompt": "A product photo of a glass perfume bottle on a marble surface, transparent background, studio lighting, the label reads AURORA in gold serif font",
"output_resolution": "2k",
"aspect_ratio": "3:4"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "gpt-image-2-text-to-image"
}
GPT Image in Hermes Agent in drei Schritten verwenden
RunAPI konfigurieren
Die Umgebungsvariable RUNAPI_API_KEY in der Shell-Konfiguration setzen. Wenn der custom:runapi Provider bereits in Hermes Agent für Chat konfiguriert ist, funktionieren derselbe Key und dieselbe base_url für GPT Image — kein zusätzliches Setup erforderlich.
export RUNAPI_API_KEY=runapi_xxx
GPT Image 2 aufrufen
Eine POST-Anfrage an den text_to_image-Endpunkt senden, model auf gpt-image-2-text-to-image setzen. Einen beschreibenden Prompt mit Layout- und Stilanweisungen angeben. output_resolution auf 2k oder 4k für höhere Detailschärfe setzen. Für die Bearbeitung bestehender Bilder den edit_image-Endpunkt mit gpt-image-2-image-to-image verwenden und source_image_urls angeben.
POST /v1/text_to_image
Ergebnis abrufen
Die API gibt sofort eine task_id zurück. Den Task-Status-Endpunkt abfragen, bis der Status auf completed wechselt, dann die Ausgabe-Bild-URL abrufen. GPT Image 2 ist typischerweise innerhalb von 10–30 Sekunden abgeschlossen, je nach Auflösung.
task_id: tsk_abc123
GPT Image API-Parameter
| Parameter | Typ | Beschreibung |
|---|---|---|
model |
string |
Erforderlich. gpt-image-2-text-to-image für Generierung, gpt-image-2-image-to-image für Bearbeitung. |
prompt |
string |
Erforderlich. Natürlichsprachliche Beschreibung des gewünschten Bildes. Unterstützt detaillierte Anweisungen zu Layout, Textoverlays und Stil. |
output_resolution |
string |
Optional. Ausgabeauflösung — 1k (Standard), 2k oder 4k. Höhere Auflösung kostet mehr pro Bild. |
aspect_ratio |
string |
Optional. Standard ist auto. Unterstützt 1:1, 3:2, 2:3, 4:3, 3:4, 16:9, 9:16 und mehr. |
source_image_urls |
array |
Erforderlich für den edit_image-Endpunkt. Eine oder mehrere URLs von zu bearbeitenden Quellbildern. |
Was ist GPT Image mit Hermes Agent?
GPT Image 2 behandelt Prompts als Produktions-Briefings statt als lose Schlüsselwortlisten. Es enthält einen Reasoning-Schritt vor der Generierung, der ihm hilft, strukturierten Anweisungen für Layout, Textplatzierung und Komposition zu folgen. Nutzer finden, dass es am besten mit einfacheren, klar strukturierten Prompts funktioniert – komplexe Multi-Pass-Verfeinerungen können Rausch-Muster einführen. Hermes Agent ruft es über den RunAPI-Custom-Provider auf.
GPT Image Anwendungsfälle
Produktfotografie mit transparenten Hintergründen
Produktshots auf transparenten Hintergründen für das Compositing in Marketingmaterialien, Kataloge oder E-Commerce-Listings ohne manuelles Masking generieren.
Social-Media-Kampagnen-Graphics
Social-Media-Visuals mit eingebettetem Text, Markenfarben und konsistentem Styling über mehrere Kampagnenbilder hinweg erstellen – den exakten Text im Prompt angeben.
Kinematische Stills für Video-Konvertierung
Video-bereite erste Frames und kinematische Stills generieren, die als Keyframes für Video-Generierungs-Workflows oder eigenständige redaktionelle Illustrationen dienen können.
GPT Image + Hermes Agent — Fragen
Ja. Hermes Agent ruft GPT Image 2 über den RunAPI text_to_image-Endpunkt auf. Das model-Feld auf gpt-image-2-text-to-image setzen und die Anfrage mit demselben RUNAPI_API_KEY senden, der für den custom:runapi Provider konfiguriert wurde. Kein ComfyUI oder GPU-Mieten erforderlich.
GPT Image 2 ist OpenAIs dediziertes Bildgenerierungsmodell mit höherer Qualität, 4K-Ausgabe und transparenter Hintergrundunterstützung. GPT-4o Image generiert Bilder im Chat-Kontext, ist aber auf 1:1-, 3:2- oder 2:3-Seitenverhältnisse beschränkt. Beide sind über RunAPI verfügbar — gpt-image-2-text-to-image für eigenständige Generierung und gpt-4o-image für chatintegrierte Bildausgabe verwenden.
Ja. GPT Image 2 kann Bilder mit transparenten Hintergründen ausgeben, wenn dies im Prompt beschrieben wird. Dies ist nützlich für Produktfotos, Logos und UI-Elemente, die zusammengesetzt werden müssen. Transparenz im Prompt beschreiben — zum Beispiel "Produktaufnahme auf transparentem Hintergrund".
GPT Image 2 wird pro Bild nach Ausgabeauflösung abgerechnet: 1k, 2k oder 4k. GPT-4o Image wird pro Bild nach Ausgabeanzahl abgerechnet — 2 oder 4 Bilder in einer Anfrage zu generieren kostet mehr pro Bild. Beide verwenden nutzungsbasierte Abrechnung ohne monatliches Minimum. Aktuelle Preise auf der RunAPI-Preisseite ansehen.
Ja. Den edit_image-Endpunkt mit model gpt-image-2-image-to-image verwenden. Quellbilder in source_image_urls übergeben und die Bearbeitung in natürlicher Sprache beschreiben — "Hintergrund entfernen", "Sonnenbrille hinzufügen", "Text zu HELLO ändern". Keine ComfyUI-Workflow-Graphen, keine GPU-Instanz, keine Inpainting-Masken erforderlich.
Hermes Agent Grundeinrichtung
Noch nicht eingerichtet? Mit der RunAPI-Einrichtungsanleitung für Hermes Agent starten.
Hermes Agent Einrichtungsanleitung →GPT Image Modellkatalog
Alle GPT Image-Varianten, Preise und API-Dokumentation ansehen.
GPT Image Modelle →GPT Image in Hermes Agent heute ausprobieren.
Einen kostenlosen RunAPI-Key holen, den custom:runapi Provider konfigurieren und mit OpenAI GPT Image 2 Bilder in Hermes Agent generieren und bearbeiten.