Używaj GPT Image w Hermes Agent.
GPT Image 2 to dedykowany model generowania obrazów OpenAI — generowanie tekstu do obrazu i edycja obrazów oparta na instrukcjach z wyjściem do rozdzielczości 4K i obsługą przezroczystego tła. Hermes Agent wywołuje go przez tego samego niestandardowego dostawcę RunAPI i klucz API używany do czatu, bez konieczności konfiguracji ComfyUI ani GPU.
Use RunAPI to generate an image with OpenAI GPT Image 2 from Hermes Agent.
Requirements:
- Use the RunAPI API at https://runapi.ai/v1/text_to_image.
- Read the API key from RUNAPI_API_KEY environment variable.
- Use the custom:runapi provider already configured in Hermes Agent.
- Set the model to "gpt-image-2-text-to-image".
- Write a descriptive prompt. GPT Image 2 follows natural language instructions closely — describe layout, style, text overlays, and transparency needs.
- Optionally set output_resolution to 1k, 2k, or 4k. Default is 1k.
- The response returns a task_id. Poll the task status endpoint until the task completes, then retrieve the output URL.
curl -X POST https://runapi.ai/v1/text_to_image \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-image-2-text-to-image",
"prompt": "A product photo of a glass perfume bottle on a marble surface, transparent background, studio lighting, the label reads AURORA in gold serif font",
"output_resolution": "2k",
"aspect_ratio": "3:4"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "gpt-image-2-text-to-image"
}
Używaj GPT Image w Hermes Agent w trzech krokach
Skonfiguruj RunAPI
Ustaw zmienną środowiskową RUNAPI_API_KEY w profilu powłoki. Jeśli dostawca custom:runapi jest już skonfigurowany w Hermes Agent do czatu, ten sam klucz i base_url działają dla GPT Image — nie jest potrzebna żadna dodatkowa konfiguracja.
export RUNAPI_API_KEY=runapi_xxx
Wywołaj GPT Image 2
Wyślij żądanie POST do punktu końcowego text_to_image z modelem ustawionym na gpt-image-2-text-to-image. Dołącz opisowy prompt z instrukcjami dotyczącymi układu i stylu. Ustaw output_resolution na 2k lub 4k, aby uzyskać wyższą szczegółowość. Do edycji istniejących obrazów użyj punktu końcowego edit_image z gpt-image-2-image-to-image i podaj source_image_urls.
POST /v1/text_to_image
Pobierz wynik
API natychmiast zwraca task_id. Odpytuj punkt końcowy statusu zadania, aż status zmieni się na completed, a następnie pobierz adres URL wyjściowego obrazu z odpowiedzi. GPT Image 2 zazwyczaj kończy działanie w ciągu 10–30 sekund w zależności od rozdzielczości.
task_id: tsk_abc123
Parametry API GPT Image
| Parametr | Typ | Opis |
|---|---|---|
model |
string |
Wymagane. gpt-image-2-text-to-image do generowania, gpt-image-2-image-to-image do edycji. |
prompt |
string |
Wymagane. Opis pożądanego obrazu w języku naturalnym. Obsługuje szczegółowe instrukcje dotyczące układu, nakładek tekstowych i stylu. |
output_resolution |
string |
Opcjonalne. Rozdzielczość wyjściowa — 1k (domyślna), 2k lub 4k. Wyższa rozdzielczość kosztuje więcej za obraz. |
aspect_ratio |
string |
Opcjonalne. Domyślnie auto. Obsługuje 1:1, 3:2, 2:3, 4:3, 3:4, 16:9, 9:16 i więcej. |
source_image_urls |
array |
Wymagane dla punktu końcowego edit_image. Jeden lub więcej adresów URL obrazów źródłowych do edycji. |
Czym jest GPT Image w Hermes Agent?
GPT Image 2 traktuje prompty jak briefy produkcyjne, a nie luźne listy słów kluczowych. Hermes Agent wywołuje go przez RunAPI custom provider dla precyzyjnego generowania obrazów w zautomatyzowanych workflow'ach projektowych.
Zastosowania GPT Image
Fotografia produktowa z przezroczystymi tłami
Generuj zdjęcia produktów na przezroczystych tłach do kompozytowania w materiałach marketingowych.
Grafiki kampanii mediów społecznościowych
Twórz wizualizacje mediów społecznościowych z osadzonym tekstem, kolorami marki i elementami kampanii.
Kadry kinematograficzne do konwersji wideo
Generuj gotowe na wideo pierwsze klatki i kadry kinematograficzne dla pipeline'ów animacyjnych.
Pytania o GPT Image + Hermes Agent
Tak. Hermes Agent wywołuje GPT Image 2 przez punkt końcowy text_to_image RunAPI. Ustaw pole model na gpt-image-2-text-to-image i wyślij żądanie z tym samym kluczem RUNAPI_API_KEY skonfigurowanym dla dostawcy custom:runapi. Nie jest wymagany ComfyUI ani wynajem GPU.
GPT Image 2 to dedykowany model generowania obrazów OpenAI o wyższej jakości, wyjściu 4K i obsłudze przezroczystego tła. GPT-4o Image generuje obrazy w kontekście czatu, ale jest ograniczony do proporcji 1:1, 3:2 lub 2:3. Oba są dostępne przez RunAPI — użyj gpt-image-2-text-to-image do samodzielnego generowania i gpt-4o-image do wyjścia obrazów zintegrowanego z czatem.
Tak. GPT Image 2 może generować obrazy z przezroczystymi tłami, gdy zostanie to wskazane w prompcie. Jest to przydatne do zdjęć produktowych, logotypów i elementów UI wymagających kompozytowania. Opisz przezroczystość w swoim prompcie — na przykład "zdjęcie produktu na przezroczystym tle".
GPT Image 2 jest rozliczany za obraz według rozdzielczości wyjściowej: 1k, 2k lub 4k. GPT-4o Image jest rozliczany za obraz według liczby wyjść — generowanie 2 lub 4 obrazów w jednym żądaniu kosztuje więcej za obraz. Oba korzystają z rozliczeń pay-as-you-go bez miesięcznego minimum. Sprawdź stronę cenową RunAPI, aby zobaczyć aktualne stawki.
Tak. Użyj punktu końcowego edit_image z modelem ustawionym na gpt-image-2-image-to-image. Przekaż obrazy źródłowe w source_image_urls i opisz edycję w języku naturalnym — "usuń tło", "dodaj okulary przeciwsłoneczne", "zmień tekst na HELLO". Nie są potrzebne grafy przepływów pracy ComfyUI, instancja GPU ani maski inpaintingu.
Ogólna konfiguracja Hermes Agent
Nie skonfigurowano jeszcze? Zacznij od przewodnika konfiguracji RunAPI dla Hermes Agent.
Przewodnik konfiguracji Hermes Agent →Katalog modeli GPT Image
Zobacz wszystkie warianty GPT Image, ceny i dokumentację API.
Modele GPT Image →Wypróbuj GPT Image w Hermes Agent już dziś.
Zdobądź darmowy klucz RunAPI, skonfiguruj dostawcę custom:runapi i zacznij generować i edytować obrazy za pomocą OpenAI GPT Image 2.