---
title: &quot;GPT Image in Hermes Agent über RunAPI verwenden — Bild-API-Anleitung&quot;
url: &quot;https://runapi.ai/de/hermes-gpt-image.md&quot;
canonical: &quot;https://runapi.ai/de/hermes-gpt-image&quot;
locale: &quot;de&quot;
model: &quot;gpt-image&quot;
---

# GPT Image in Hermes Agent verwenden.

GPT Image 2 ist OpenAIs dediziertes Bildgenerierungsmodell — Text-zu-Bild und anweisungsbasierte Bildbearbeitung mit bis zu 4K-Ausgabeauflösung und transparenter Hintergrundunterstützung. Hermes Agent ruft es über denselben RunAPI custom Provider und API-Key auf, der für Chat verwendet wird — kein ComfyUI oder GPU-Setup erforderlich.

## API example

```bash
curl -X POST https://runapi.ai/v1/text_to_image \
  -H &quot;Authorization: Bearer $RUNAPI_API_KEY&quot; \
  -H &quot;Content-Type: application/json&quot; \
  -d &#39;{
    &quot;model&quot;: &quot;gpt-image-2-text-to-image&quot;,
    &quot;prompt&quot;: &quot;A product photo of a glass perfume bottle on a marble surface, transparent background, studio lighting, the label reads AURORA in gold serif font&quot;,
    &quot;output_resolution&quot;: &quot;2k&quot;,
    &quot;aspect_ratio&quot;: &quot;3:4&quot;
  }&#39;

```

### Response

```json
{
  &quot;task_id&quot;: &quot;tsk_abc123&quot;,
  &quot;status&quot;: &quot;pending&quot;,
  &quot;model&quot;: &quot;gpt-image-2-text-to-image&quot;
}

```

## How it works

1. **RunAPI konfigurieren** — Die Umgebungsvariable RUNAPI_API_KEY in der Shell-Konfiguration setzen. Wenn der custom:runapi Provider bereits in Hermes Agent für Chat konfiguriert ist, funktionieren derselbe Key und dieselbe base_url für GPT Image — kein zusätzliches Setup erforderlich.
2. **GPT Image 2 aufrufen** — Eine POST-Anfrage an den text_to_image-Endpunkt senden, model auf gpt-image-2-text-to-image setzen. Einen beschreibenden Prompt mit Layout- und Stilanweisungen angeben. output_resolution auf 2k oder 4k für höhere Detailschärfe setzen. Für die Bearbeitung bestehender Bilder den edit_image-Endpunkt mit gpt-image-2-image-to-image verwenden und source_image_urls angeben.
3. **Ergebnis abrufen** — Die API gibt sofort eine task_id zurück. Den Task-Status-Endpunkt abfragen, bis der Status auf completed wechselt, dann die Ausgabe-Bild-URL abrufen. GPT Image 2 ist typischerweise innerhalb von 10–30 Sekunden abgeschlossen, je nach Auflösung.

## Parameters

| Parameter | Type | Description |
|-----------|------|-------------|
| `model` | `string` | Erforderlich. gpt-image-2-text-to-image für Generierung, gpt-image-2-image-to-image für Bearbeitung. |
| `prompt` | `string` | Erforderlich. Natürlichsprachliche Beschreibung des gewünschten Bildes. Unterstützt detaillierte Anweisungen zu Layout, Textoverlays und Stil. |
| `output_resolution` | `string` | Optional. Ausgabeauflösung — 1k (Standard), 2k oder 4k. Höhere Auflösung kostet mehr pro Bild. |
| `aspect_ratio` | `string` | Optional. Standard ist auto. Unterstützt 1:1, 3:2, 2:3, 4:3, 3:4, 16:9, 9:16 und mehr. |
| `source_image_urls` | `array` | Erforderlich für den edit_image-Endpunkt. Eine oder mehrere URLs von zu bearbeitenden Quellbildern. |

## FAQ

### Kann ich GPT Image 2 in Hermes Agent verwenden?

Ja. Hermes Agent ruft GPT Image 2 über den RunAPI text_to_image-Endpunkt auf. Das model-Feld auf gpt-image-2-text-to-image setzen und die Anfrage mit demselben RUNAPI_API_KEY senden, der für den custom:runapi Provider konfiguriert wurde. Kein ComfyUI oder GPU-Mieten erforderlich.

### Was ist der Unterschied zwischen GPT Image 2 und GPT-4o Image?

GPT Image 2 ist OpenAIs dediziertes Bildgenerierungsmodell mit höherer Qualität, 4K-Ausgabe und transparenter Hintergrundunterstützung. GPT-4o Image generiert Bilder im Chat-Kontext, ist aber auf 1:1-, 3:2- oder 2:3-Seitenverhältnisse beschränkt. Beide sind über RunAPI verfügbar — gpt-image-2-text-to-image für eigenständige Generierung und gpt-4o-image für chatintegrierte Bildausgabe verwenden.

### Unterstützt GPT Image 2 transparente Hintergründe?

Ja. GPT Image 2 kann Bilder mit transparenten Hintergründen ausgeben, wenn dies im Prompt beschrieben wird. Dies ist nützlich für Produktfotos, Logos und UI-Elemente, die zusammengesetzt werden müssen. Transparenz im Prompt beschreiben — zum Beispiel &quot;Produktaufnahme auf transparentem Hintergrund&quot;.

### Wie unterscheidet sich die Preisgestaltung von GPT Image 2 von GPT-4o Image?

GPT Image 2 wird pro Bild nach Ausgabeauflösung abgerechnet: 1k, 2k oder 4k. GPT-4o Image wird pro Bild nach Ausgabeanzahl abgerechnet — 2 oder 4 Bilder in einer Anfrage zu generieren kostet mehr pro Bild. Beide verwenden nutzungsbasierte Abrechnung ohne monatliches Minimum. Aktuelle Preise auf der RunAPI-Preisseite ansehen.

### Kann Hermes Agent Bilder mit GPT Image 2 statt ComfyUI bearbeiten?

Ja. Den edit_image-Endpunkt mit model gpt-image-2-image-to-image verwenden. Quellbilder in source_image_urls übergeben und die Bearbeitung in natürlicher Sprache beschreiben — &quot;Hintergrund entfernen&quot;, &quot;Sonnenbrille hinzufügen&quot;, &quot;Text zu HELLO ändern&quot;. Keine ComfyUI-Workflow-Graphen, keine GPU-Instanz, keine Inpainting-Masken erforderlich.


## Links

- [Hermes Agent Einrichtungsanleitung →](https://runapi.ai/de/hermes-agent)
- [GPT Image Modelle →](https://runapi.ai/de/models/gpt-image)
- [Model catalog](https://runapi.ai/de/models)
- [API docs](https://runapi.ai/de/docs)
