Czy można używać GPT Image 2 w Hermes Agent?

Tak. Hermes Agent wywołuje GPT Image 2 przez punkt końcowy text_to_image RunAPI. Ustaw pole model na gpt-image-2-text-to-image i wyślij żądanie z tym samym kluczem RUNAPI_API_KEY skonfigurowanym dla dostawcy custom:runapi. Nie jest wymagany ComfyUI ani wynajem GPU.

Jaka jest różnica między GPT Image 2 a GPT-4o Image?

GPT Image 2 to dedykowany model generowania obrazów OpenAI o wyższej jakości, wyjściu 4K i obsłudze przezroczystego tła. GPT-4o Image generuje obrazy w kontekście czatu, ale jest ograniczony do proporcji 1:1, 3:2 lub 2:3. Oba są dostępne przez RunAPI — użyj gpt-image-2-text-to-image do samodzielnego generowania i gpt-4o-image do wyjścia obrazów zintegrowanego z czatem.

Czy GPT Image 2 obsługuje przezroczyste tła?

Tak. GPT Image 2 może generować obrazy z przezroczystymi tłami, gdy zostanie to wskazane w prompcie. Jest to przydatne do zdjęć produktowych, logotypów i elementów UI wymagających kompozytowania. Opisz przezroczystość w swoim prompcie — na przykład "zdjęcie produktu na przezroczystym tle".

Jak GPT Image 2 jest wyceniony inaczej niż GPT-4o Image?

GPT Image 2 jest rozliczany za obraz według rozdzielczości wyjściowej: 1k, 2k lub 4k. GPT-4o Image jest rozliczany za obraz według liczby wyjść — generowanie 2 lub 4 obrazów w jednym żądaniu kosztuje więcej za obraz. Oba korzystają z rozliczeń pay-as-you-go bez miesięcznego minimum. Sprawdź stronę cenową RunAPI, aby zobaczyć aktualne stawki.

Czy Hermes Agent może edytować obrazy za pomocą GPT Image 2 zamiast ComfyUI?

Tak. Użyj punktu końcowego edit_image z modelem ustawionym na gpt-image-2-image-to-image. Przekaż obrazy źródłowe w source_image_urls i opisz edycję w języku naturalnym — "usuń tło", "dodaj okulary przeciwsłoneczne", "zmień tekst na HELLO". Nie są potrzebne grafy przepływów pracy ComfyUI, instancja GPU ani maski inpaintingu.

HERMES + GPT IMAGE

Używaj GPT Image w Hermes Agent.

GPT Image 2 to dedykowany model generowania obrazów OpenAI — generowanie tekstu do obrazu i edycja obrazów oparta na instrukcjach z wyjściem do rozdzielczości 4K i obsługą przezroczystego tła. Hermes Agent wywołuje go przez tego samego niestandardowego dostawcę RunAPI i klucz API używany do czatu, bez konieczności konfiguracji ComfyUI ani GPU.

Pobierz API Key Przeczytaj dokumentację

jeden klucz API · tekst do obrazu + edycja obrazu · wyjście do 4K

Use RunAPI to generate an image with OpenAI GPT Image 2 from Hermes Agent.

Requirements:
- Use the RunAPI API at https://runapi.ai/v1/text_to_image.
- Read the API key from RUNAPI_API_KEY environment variable.
- Use the custom:runapi provider already configured in Hermes Agent.
- Set the model to "gpt-image-2-text-to-image".
- Write a descriptive prompt. GPT Image 2 follows natural language instructions closely — describe layout, style, text overlays, and transparency needs.
- Optionally set output_resolution to 1k, 2k, or 4k. Default is 1k.
- The response returns a task_id. Poll the task status endpoint until the task completes, then retrieve the output URL.

curl -X POST https://runapi.ai/v1/text_to_image \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2-text-to-image",
    "prompt": "A product photo of a glass perfume bottle on a marble surface, transparent background, studio lighting, the label reads AURORA in gold serif font",
    "output_resolution": "2k",
    "aspect_ratio": "3:4"
  }'

{
  "task_id": "tsk_abc123",
  "status": "pending",
  "model": "gpt-image-2-text-to-image"
}

Skopiuj polecenie curl do testowania gpt-image

JAK TO DZIAŁA

Używaj GPT Image w Hermes Agent w trzech krokach

Skonfiguruj RunAPI

Ustaw zmienną środowiskową RUNAPI_API_KEY w profilu powłoki. Jeśli dostawca custom:runapi jest już skonfigurowany w Hermes Agent do czatu, ten sam klucz i base_url działają dla GPT Image — nie jest potrzebna żadna dodatkowa konfiguracja.

export RUNAPI_API_KEY=runapi_xxx

Wywołaj GPT Image 2

Wyślij żądanie POST do punktu końcowego text_to_image z modelem ustawionym na gpt-image-2-text-to-image. Dołącz opisowy prompt z instrukcjami dotyczącymi układu i stylu. Ustaw output_resolution na 2k lub 4k, aby uzyskać wyższą szczegółowość. Do edycji istniejących obrazów użyj punktu końcowego edit_image z gpt-image-2-image-to-image i podaj source_image_urls.

POST /v1/text_to_image

Pobierz wynik

API natychmiast zwraca task_id. Odpytuj punkt końcowy statusu zadania, aż status zmieni się na completed, a następnie pobierz adres URL wyjściowego obrazu z odpowiedzi. GPT Image 2 zazwyczaj kończy działanie w ciągu 10–30 sekund w zależności od rozdzielczości.

task_id: tsk_abc123

PARAMETRY

Parametry API GPT Image

Parametr	Typ	Opis
`model`	`string`	Wymagane. gpt-image-2-text-to-image do generowania, gpt-image-2-image-to-image do edycji.
`prompt`	`string`	Wymagane. Opis pożądanego obrazu w języku naturalnym. Obsługuje szczegółowe instrukcje dotyczące układu, nakładek tekstowych i stylu.
`output_resolution`	`string`	Opcjonalne. Rozdzielczość wyjściowa — 1k (domyślna), 2k lub 4k. Wyższa rozdzielczość kosztuje więcej za obraz.
`aspect_ratio`	`string`	Opcjonalne. Domyślnie auto. Obsługuje 1:1, 3:2, 2:3, 4:3, 3:4, 16:9, 9:16 i więcej.
`source_image_urls`	`array`	Wymagane dla punktu końcowego edit_image. Jeden lub więcej adresów URL obrazów źródłowych do edycji.

Czym jest GPT Image w Hermes Agent?

GPT Image 2 traktuje prompty jak briefy produkcyjne, a nie luźne listy słów kluczowych. Hermes Agent wywołuje go przez RunAPI custom provider dla precyzyjnego generowania obrazów w zautomatyzowanych workflow'ach projektowych.

Zastosowania GPT Image

Fotografia produktowa z przezroczystymi tłami

Generuj zdjęcia produktów na przezroczystych tłach do kompozytowania w materiałach marketingowych.

Grafiki kampanii mediów społecznościowych

Twórz wizualizacje mediów społecznościowych z osadzonym tekstem, kolorami marki i elementami kampanii.

Kadry kinematograficzne do konwersji wideo

Generuj gotowe na wideo pierwsze klatki i kadry kinematograficzne dla pipeline'ów animacyjnych.

FAQ

Pytania o GPT Image + Hermes Agent

Ogólna konfiguracja Hermes Agent

Nie skonfigurowano jeszcze? Zacznij od przewodnika konfiguracji RunAPI dla Hermes Agent.

Przewodnik konfiguracji Hermes Agent →

Katalog modeli GPT Image

Zobacz wszystkie warianty GPT Image, ceny i dokumentację API.

Modele GPT Image →

Wypróbuj GPT Image w Hermes Agent już dziś.

Zdobądź darmowy klucz RunAPI, skonfiguruj dostawcę custom:runapi i zacznij generować i edytować obrazy za pomocą OpenAI GPT Image 2.

Przeglądaj modele →