Flux, Imagen 4 und GPT Image in OpenClaw — ohne zusätzliche Skills
Derselbe API Key, den dein OpenClaw-Agent für Chat nutzt, ruft auch Flux Kontext, Imagen 4, Seedream und GPT Image 2 auf — über 10 Bildmodelle, kein zusätzlicher Skill nötig. KI-Bildgenerierung ab 2 Cent pro Bild, nutzungsbasiert (Pay-as-you-go).
Install the RunAPI CLI and generate an image in this OpenClaw workspace.
- Run: npx runapi
- It will prompt you for an API key. Sign up at https://runapi.ai if you don't have one.
- Then run: npx runapi run text_to_image --model flux-kontext-pro --prompt "A red cube on a white table"
- Confirm the image URL appears in the output.
Available image models: flux-kontext-pro, imagen-4, seedream-5-lite-text-to-image, gpt-image-2-text-to-image.
Vier Bildmodelle, ein API Key, null zusätzliche Skills
Jedes Modell deckt einen anderen Produktionsbedarf ab. Flux Kontext übernimmt markengerechte Bearbeitungen und Textdarstellung. Imagen 4 liefert fotorealistische Ausgaben mit starker Prompt-Treue. Seedream 5 Lite ist schnell und günstig für Hochvolumen-Workflows. GPT Image 2 glänzt bei instruktionsgesteuerten Bearbeitungen und Compositing. Alle vier lassen sich vom selben RunAPI-Endpoint aufrufen, den dein OpenClaw-Agent bereits für Chat nutzt.
Textdarstellung, Markenkonsistenz und kontextbezogene Bearbeitungen. Stark für Marketing-Assets, bei denen Text-Overlays und Stilreferenzen zählen. Ab 2,5 Cent pro Bild.
Fotorealistische Generierung mit hoher Prompt-Treue. Standard-, Fast- und Ultra-Tiers ermöglichen den Tausch von Geschwindigkeit gegen Detail. Ab 2 Cent pro Bild.
Schnelle, günstige Generierung für Bulk-Workflows. Unterstützt Text-zu-Bild und Bild-zu-Bild für 2,75 Cent pro Aufruf — geeignet für Prototyping und Iteration.
Instruktionsgesteuerte Bearbeitungen und Compositing. Ideal für Aufgaben, bei denen der Prompt eine Transformation beschreibt — Hintergrundentfernung, Stilübertragung, Objektplatzierung.
Bilder in OpenClaw über RunAPI generieren
RunAPI in OpenClaw konfigurieren
Falls du RunAPI noch nicht in OpenClaw eingerichtet hast, folge der OpenClaw-Setup-Anleitung. Füge den RunAPI-Provider mit der baseUrl https://runapi.ai/v1 und deiner RUNAPI_API_KEY-Umgebungsvariablen hinzu.
Bildgenerierungsanfrage senden
Nutze den RunAPI-Task-Endpoint aus deinem Agent-Code oder einem direkten HTTP-Aufruf. Setze das Feld model auf den Slug des Bildmodells, z. B. flux-kontext-pro, imagen-4 oder gpt-image-2. Der Request-Body folgt demselben JSON-Muster wie LLM-Aufrufe.
Ergebnis abfragen und abrufen
Bildtasks liefern eine Task-ID zurück. Frage den Task-Status-Endpoint ab oder nutze einen Webhook-Callback. Wenn der Task abgeschlossen ist, enthält die Antwort die URL des generierten Bildes. RunAPI SDKs und das CLI übernehmen das Polling automatisch.
Flux Kontext vs. Imagen 4 vs. Seedream vs. GPT Image 2
| Vergleichspunkt | Flux Kontext Pro | Imagen 4 | Seedream 5 Lite | GPT Image 2 |
|---|---|---|---|---|
| Beste Standardnutzung | Markengerechte Bearbeitungen, Text-Overlays, Logo-Platzierung und kontextbezogene Bildbearbeitung mit Stilreferenzen. | Fotorealistische Generierung aus detaillierten Prompts, Produktfotografie und hochwertige Einzelbildausgabe. | Schnelle Massengenerierung und Prototyping, bei denen Geschwindigkeit und Kosten wichtiger sind als maximales Detail. | Instruktionsgesteuertes Compositing, Hintergrundänderungen, Stilübertragungen und mehrstufige Bildbearbeitung. |
| Eingabetypen | Text-Prompt, Referenzbild für kontextbezogene Bearbeitung, Stilreferenzen. | Text-Prompt. Fast-, Standard- und Ultra-Qualitätsstufen. | Text-Prompt, Bild-zu-Bild mit einer Quellbild-URL. | Text-Prompt für Generierung, Text plus Bild-URL für Bearbeitung und Compositing. |
| Ausgabequalität | Hohe Detailgenauigkeit mit präziser Textdarstellung. Stark darin, Markenelemente über Bearbeitungen hinweg zu erhalten. | Fotorealistisch mit starker Prompt-Treue. Ultra-Tier für maximales Detail. | Gute Qualität bei hoher Geschwindigkeit. Geeignet für Entwürfe, Thumbnails und Iterationsschleifen. | Hohe Qualität mit starker Befolgung von Instruktionen. Ideal für Bearbeitungen, die räumliche Beziehungen verstehen müssen. |
| Geschwindigkeit | Standardmäßige Generierungsgeschwindigkeit. Geeignet für interaktive und Batch-Workflows. | Fast-Tier für nahezu sofortige Ausgabe verfügbar. Standard- und Ultra-Tier tauschen Geschwindigkeit gegen Qualität. | Schnellstes der vier Modelle. Optimiert für Hochvolumen-Pipelines. | Standardgeschwindigkeit. Etwas langsamer bei komplexen mehrstufigen Bearbeitungen. |
| Kosten pro Bild | Ab 2,5 Cent (Pro). Max-Tier bei 5 Cent für höhere Wiedergabetreue. | Von 2 Cent (Fast) bis 6 Cent (Ultra). Standard bei 4 Cent. | 2,75 Cent pro Bild für Text-zu-Bild und Bild-zu-Bild. | Ab 3 Cent. Auflösungsbasierte Preisgestaltung. |
| Beste Nutzung für OpenClaw-Agents | Wenn der Agent-Workflow Marken-Assets, Marketing-Bilder oder textlastige Grafiken beinhaltet. | Wenn der Agent fotorealistische Ausgabe aus einer Beschreibung in natürlicher Sprache benötigt. | Wenn der Agent viele Bilder pro Session generiert und Kosten oder Geschwindigkeit Priorität haben. | Wenn der Agent bestehende Bilder basierend auf Nutzerinstruktionen bearbeitet. |
Marketing-Asset-Generierung
OpenClaw-Agents können Produktbilder, Social-Media-Grafiken und Werbemittel generieren, indem sie Flux Kontext oder Imagen 4 aufrufen. Der Agent erstellt den Prompt aus dem Gesprächskontext und ruft das fertige Bild in derselben Session ab.
Flux Kontext entdeckenAutomatisierte Bildbearbeitung
Übergib eine vorhandene Bild-URL an GPT Image 2 oder Seedream mit einer Bearbeitungsanweisung. Der Agent kann Hintergründe entfernen, Stile wechseln oder Elemente zusammensetzen — ohne manuelle Design-Tools.
GPT Image 2 entdeckenHochvolumen-Bilditeration
OpenClaw-Agents, die UI-Komponenten, Social Ads oder Produktvariationen prototypisieren, profitieren von Seedream 5 Lites Geschwindigkeit und niedrigen Kosten pro Bild. Generiere 20 Entwürfe pro Session und leite den ausgewählten Prompt für die finale Ausgabe an Flux Kontext Pro weiter.
Seedream entdeckenBilder über den RunAPI-Task-Endpoint generieren
Nutze denselben RunAPI Key und denselben Task-Lifecycle für jedes Bildmodell. Ändere den Modell-Slug und den Endpoint, um zwischen Flux, Imagen, Seedream und GPT Image zu wechseln. Die Antwort liefert eine Task-ID für das Polling.
{
"model": "flux-kontext-pro",
"prompt": "A futuristic city skyline at sunset, photorealistic, 8K detail"
}
{
"model": "imagen-4",
"prompt": "A golden retriever wearing astronaut suit, studio lighting"
}
{
"model": "gpt-image-2",
"prompt": "Remove the background and add a tropical beach",
"image_url": "https://example.com/photo.jpg"
}
Derselbe API Key generiert Video und Musik
Videogenerierung
Generiere Videoclips mit Kling 3.0, Veo 3 und Seedance 2.0. Text-zu-Video- und Bild-zu-Video-Endpoints folgen demselben asynchronen Task-Lifecycle wie die Bildgenerierung.
Video-APIs vergleichenMusikerstellung
Erstelle Musiktracks mit Suno v4, v4.5 und v5. Beschreibe Genre, Stimmung und Texte im Prompt. Der Agent erhält Audio-URLs, wenn der Task abgeschlossen ist.
Suno-Modelle entdeckenKI-Bildgenerierung ab 2 Cent pro Bild
RunAPI nutzt nutzungsbasierte Abrechnung (Pay-as-you-go) ohne monatliches Abonnement. Jedes Bildmodell hat einen Preis pro Generierung, abhängig von Modell-Tier und Ausgabeauflösung. Flux Kontext Pro ab 2,5 Cent, Imagen 4 Fast ab 2 Cent, Seedream 5 Lite ab 2,75 Cent und GPT Image 2 ab 3 Cent. Aktuelle Preise für alle 113+ Modelle auf der Live-Preisseite prüfen.
Preismethodik
Die Preise auf dieser Seite spiegeln die RunAPI-Pay-as-you-go-Tarife zum Zeitpunkt der Veröffentlichung wider. RunAPI legt Preise basierend auf Rechenkosten zuzüglich einer transparenten Marge fest. Die tatsächlichen Kosten pro Bild können je nach Auflösung, Qualitätsstufe oder modellspezifischen Optionen variieren. Aktuelle Preise vor dem Produktionseinsatz immer auf der Live-Preisseite bestätigen.
FAQ zur OpenClaw-Bildgenerierung
Wie wähle ich zwischen Flux Kontext und Imagen 4 für meinen OpenClaw-Workflow?
Nutze Flux Kontext Pro, wenn der Agent Marken-Assets, Marketing-Bilder oder Grafiken mit Text erstellt — er erhält Stile und rendert Text präzise. Nutze Imagen 4, wenn der Agent fotorealistische Ausgabe aus einer Beschreibung in natürlicher Sprache benötigt. Beide sind über denselben RunAPI-Endpoint verfügbar.
Welche Bildmodelle funktionieren mit OpenClaw über RunAPI?
Flux Kontext Pro und Max, Imagen 4 in Fast-, Standard- und Ultra-Tier, Seedream 5 Lite, GPT Image 2, Nano Banana und weitere. Über 10 Bildmodelle von 6 API-Anbietern sind über denselben API Key verfügbar. Die vollständige Liste ist auf der RunAPI-Preisseite einsehbar und wird automatisch aktualisiert, wenn neue Modelle hinzukommen.
Wie viel kostet die Bildgenerierung über RunAPI?
Die Preise beginnen bei 2 Cent pro Bild mit Imagen 4 Fast. Flux Kontext Pro kostet 2,5 Cent, Seedream 5 Lite 2,75 Cent und GPT Image 2 ab 3 Cent. Alle Preise sind nutzungsbasiert ohne monatliches Minimum.
Berechnet RunAPI Bildaufrufe und LLM-Aufrufe getrennt?
Nein. RunAPI nutzt ein einziges Credits-Guthaben für alle Modalitäten. Bild-, Video-, Musik- und LLM-Aufrufe ziehen alle vom selben Konto-Guthaben ab. Es gibt kein modalitätsspezifisches Abonnement oder eine Mindestausgabe. Den Verbrauch pro Modell kannst du im RunAPI-Dashboard einsehen.
Wie wechsle ich zwischen Bildmodellen in meinem OpenClaw-Workflow?
Ändere das Feld model im Request-Body. Endpoint, API Key, Task-Lifecycle und Polling-Muster bleiben gleich. Dein Agent kann je nach Aufgabe zu verschiedenen Modellen routen, ohne den Integrationscode zu ändern. Zum Beispiel: Entwürfe an seedream-5-lite-text-to-image routen und finale Exporte an flux-kontext-pro.
Ist RunAPI günstiger als fal.ai oder Replicate für die Bildgenerierung?
Die Bildgenerierung mit RunAPI beginnt bei 2 Cent pro Bild, verglichen mit fal.ai bei ca. 4 Cent und Replicate bei ca. 3,5 Cent pro Bild. Die Preise variieren je nach Modell und Auflösung. Aktuelle Preise pro Modell auf der RunAPI-Preisseite prüfen.
Bildgenerierung in OpenClaw in Minuten hinzufügen.
Ein RunAPI Key gibt deinem OpenClaw-Agent Zugriff auf Flux Kontext, Imagen 4, Seedream, GPT Image 2 und über 100 weitere Modelle für Bilder, Video, Musik und LLM. Keine zusätzlichen Skills, keine zusätzlichen Abrechnungskonten.