Używaj GPT Image w OpenClaw.
GPT Image 2 to dedykowany model generowania obrazów OpenAI — generowanie tekstu do obrazu i edycja obrazów oparta na instrukcjach z wyjściem do rozdzielczości 4K i obsługą przezroczystego tła. Agenty OpenClaw wywołują go przez ten sam klucz RunAPI i punkt końcowy /v1 używany do czatu, bez konieczności instalowania dodatkowych umiejętności.
Use RunAPI to generate an image with OpenAI GPT Image 2.
Requirements:
- Use the RunAPI API at https://runapi.ai/v1/text_to_image.
- Read the API key from RUNAPI_API_KEY environment variable.
- Set the model to "gpt-image-2-text-to-image".
- Write a descriptive prompt. GPT Image 2 follows natural language instructions closely — describe layout, style, text overlays, and transparency needs.
- Optionally set output_resolution to 1k, 2k, or 4k. Default is 1k.
- The response returns a task_id. Poll the task status endpoint until the task completes, then retrieve the output URL.
curl -X POST https://runapi.ai/v1/text_to_image \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-image-2-text-to-image",
"prompt": "A product photo of a glass perfume bottle on a marble surface, transparent background, studio lighting, the label reads AURORA in gold serif font",
"output_resolution": "2k",
"aspect_ratio": "3:4"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "gpt-image-2-text-to-image"
}
Używaj GPT Image w OpenClaw w trzech krokach
Skonfiguruj RunAPI
Ustaw zmienną środowiskową RUNAPI_API_KEY w profilu powłoki. Jeśli RunAPI jest już skonfigurowany w OpenClaw do czatu, ten sam klucz działa dla GPT Image — nie jest potrzebna żadna dodatkowa konfiguracja.
export RUNAPI_API_KEY=runapi_xxx
Wywołaj GPT Image 2
Wyślij żądanie POST do punktu końcowego text_to_image z modelem ustawionym na gpt-image-2-text-to-image. Dołącz opisowy prompt z instrukcjami dotyczącymi układu i stylu. Ustaw output_resolution na 2k lub 4k, aby uzyskać wyższą szczegółowość. Do edycji istniejących obrazów użyj punktu końcowego edit_image z gpt-image-2-image-to-image i podaj source_image_urls.
POST /v1/text_to_image
Pobierz wynik
API natychmiast zwraca task_id. Odpytuj punkt końcowy statusu zadania, aż status zmieni się na completed, a następnie pobierz adres URL wyjściowego obrazu z odpowiedzi. GPT Image 2 zazwyczaj kończy działanie w ciągu 10–30 sekund w zależności od rozdzielczości.
task_id: tsk_abc123
Parametry API GPT Image
| Parametr | Typ | Opis |
|---|---|---|
model |
string |
Wymagane. gpt-image-2-text-to-image do generowania, gpt-image-2-image-to-image do edycji. |
prompt |
string |
Wymagane. Opis pożądanego obrazu w języku naturalnym. Obsługuje szczegółowe instrukcje dotyczące układu, nakładek tekstowych i stylu. |
output_resolution |
string |
Opcjonalne. Rozdzielczość wyjściowa — 1k (domyślna), 2k lub 4k. Wyższa rozdzielczość kosztuje więcej za obraz. |
aspect_ratio |
string |
Opcjonalne. Domyślnie auto. Obsługuje 1:1, 3:2, 2:3, 4:3, 3:4, 16:9, 9:16 i więcej. |
source_image_urls |
array |
Wymagane dla punktu końcowego edit_image. Jeden lub więcej adresów URL obrazów źródłowych do edycji. |
Czym jest GPT Image w OpenClaw?
GPT Image 2 to dedykowany model obrazów OpenAI, który działa bardziej jak ustrukturyzowany brief projektowy niż luźna lista słów kluczowych. Dostarcza precyzyjne renderowanie tekstu, dokładne kolory i spójne kompozycje. Agenty OpenClaw wywołują go przez RunAPI.
Zastosowania GPT Image
Makiety UI i wireframe'y projektu aplikacji
Generuj szczegółowe makiety UI z pisanych opisów, w tym elementy tekstowe i strukturę układu.
Plakaty i prezentacje z dużą ilością tekstu
Twórz plakaty z precyzyjnym tekstem, infografiki i slajdy prezentacji z dokładnie renderowanym tekstem.
Arkusze projektu postaci
Generuj arkusze projektu postaci z widokami obrotowymi ze szczegółowych opisów.
Pytania o GPT Image + OpenClaw
Tak. Agenty OpenClaw wywołują GPT Image 2 przez punkt końcowy text_to_image RunAPI. Ustaw pole model na gpt-image-2-text-to-image i wyślij żądanie z tym samym kluczem RUNAPI_API_KEY, którego używasz do czatu. Nie są wymagane żadne dodatkowe umiejętności ani wtyczki.
GPT Image 2 to dedykowany model generowania obrazów OpenAI o wyższej jakości, wyjściu 4K i obsłudze przezroczystego tła. GPT-4o Image generuje obrazy w kontekście czatu, ale jest ograniczony do proporcji 1:1, 3:2 lub 2:3. Oba są dostępne przez RunAPI — użyj gpt-image-2-text-to-image do samodzielnego generowania i gpt-4o-image do wyjścia obrazów zintegrowanego z czatem.
Tak. GPT Image 2 może generować obrazy z przezroczystymi tłami, gdy zostanie to wskazane w prompcie. Jest to przydatne do zdjęć produktowych, logotypów i elementów UI. Określ przezroczystość w swoim prompcie — na przykład "zdjęcie produktu z przezroczystym tłem".
GPT Image 2 jest rozliczany za obraz na podstawie rozdzielczości wyjściowej: 1k jest najtańsza, 2k to średni zakres, a 4k jest najdroższa. Ta sama stawka dotyczy zarówno text_to_image, jak i edit_image. Sprawdź stronę cenową RunAPI, aby zobaczyć aktualne stawki za obraz. Nieudane generowania nie są rozliczane.
Tak. Użyj punktu końcowego edit_image z modelem ustawionym na gpt-image-2-image-to-image. Przekaż adresy URL obrazów źródłowych w source_image_urls i opisz edycję w prompcie — na przykład "zmień tło na zachód słońca nad plażą" lub "dodaj czerwony kapelusz do osoby". GPT Image 2 stosuje się do instrukcji edycji w języku naturalnym.
Ogólna konfiguracja OpenClaw
Nie skonfigurowano jeszcze? Zacznij od przewodnika konfiguracji RunAPI dla OpenClaw.
Przewodnik konfiguracji OpenClaw →Katalog modeli GPT Image
Zobacz wszystkie warianty GPT Image, ceny i dokumentację API.
Modele GPT Image →Wypróbuj GPT Image w OpenClaw już dziś.
Zdobądź darmowy klucz RunAPI, wklej prompt do OpenClaw i zacznij generować i edytować obrazy za pomocą OpenAI GPT Image 2.