Usa GPT Image in Hermes Agent.
GPT Image 2 è il modello dedicato di OpenAI per la generazione di immagini — text-to-image e modifica immagini basata su istruzioni con risoluzione di output fino a 4K e supporto per sfondo trasparente. Hermes Agent lo chiama tramite lo stesso provider custom RunAPI e la stessa API key usati per la chat, senza necessità di ComfyUI o GPU.
Usa RunAPI per generare un'immagine con OpenAI GPT Image 2 da Hermes Agent.
Requisiti:
- Usa l'API RunAPI su https://runapi.ai/v1/text_to_image.
- Leggi la API key dalla variabile d'ambiente RUNAPI_API_KEY.
- Usa il provider custom:runapi già configurato in Hermes Agent.
- Imposta il model su "gpt-image-2-text-to-image".
- Scrivi un prompt descrittivo. GPT Image 2 segue attentamente le istruzioni in linguaggio naturale — descrivi layout, stile, sovrapposizioni di testo e necessità di trasparenza.
- Facoltativamente imposta output_resolution su 1k, 2k o 4k. Il valore predefinito è 1k.
- La risposta restituisce un task_id. Esegui il polling dell'endpoint di stato del task finché il task non viene completato, poi recupera l'URL di output.
curl -X POST https://runapi.ai/v1/text_to_image \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-image-2-text-to-image",
"prompt": "A product photo of a glass perfume bottle on a marble surface, transparent background, studio lighting, the label reads AURORA in gold serif font",
"output_resolution": "2k",
"aspect_ratio": "3:4"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "gpt-image-2-text-to-image"
}
Usa GPT Image in Hermes Agent in tre passaggi
Configura RunAPI
Imposta la variabile d'ambiente RUNAPI_API_KEY nel tuo profilo shell. Se il provider custom:runapi è già configurato in Hermes Agent per la chat, la stessa key e base_url funzionano per GPT Image — nessuna configurazione aggiuntiva necessaria.
export RUNAPI_API_KEY=runapi_xxx
Chiama GPT Image 2
Invia una richiesta POST all'endpoint text_to_image con model impostato su gpt-image-2-text-to-image. Includi un prompt descrittivo con istruzioni di layout e stile. Imposta output_resolution su 2k o 4k per maggiore dettaglio. Per modificare immagini esistenti, usa l'endpoint edit_image con gpt-image-2-image-to-image e fornisci source_image_urls.
POST /v1/text_to_image
Ottieni il risultato
L'API restituisce immediatamente un task_id. Esegui il polling dell'endpoint di stato del task finché lo stato non cambia in completed, poi recupera l'URL dell'immagine di output dalla risposta. GPT Image 2 in genere completa entro 10–30 secondi a seconda della risoluzione.
task_id: tsk_abc123
Parametri API GPT Image
| Parametro | Tipo | Descrizione |
|---|---|---|
model |
string |
Obbligatorio. gpt-image-2-text-to-image per la generazione, gpt-image-2-image-to-image per la modifica. |
prompt |
string |
Obbligatorio. Descrizione in linguaggio naturale dell'immagine desiderata. Supporta istruzioni dettagliate per layout, sovrapposizioni di testo e stile. |
output_resolution |
string |
Facoltativo. Risoluzione di output — 1k (predefinito), 2k o 4k. Una risoluzione più alta costa di più per immagine. |
aspect_ratio |
string |
Facoltativo. Il valore predefinito è auto. Supporta 1:1, 3:2, 2:3, 4:3, 3:4, 16:9, 9:16 e altro. |
source_image_urls |
array |
Obbligatorio per l'endpoint edit_image. Uno o più URL di immagini sorgente da modificare. |
Cos'è GPT Image su Hermes Agent?
GPT Image 2 tratta i prompt come brief di produzione piuttosto che come elenchi di parole chiave vaghe. Include un passaggio di ragionamento prima della generazione, che lo aiuta a seguire istruzioni strutturate per il layout, il posizionamento del testo e la composizione. Gli utenti trovano che funziona meglio con prompt più semplici e chiaramente strutturati -- i raffinamenti complessi multi-passaggio possono introdurre pattern di rumore. Hermes Agent lo chiama tramite il provider personalizzato RunAPI.
Casi d'uso di GPT Image
Fotografia di prodotti con sfondi trasparenti
Generare foto di prodotti su sfondi trasparenti per il compositing in materiali di marketing, cataloghi o listini e-commerce senza mascheratura manuale.
Grafiche per campagne sui social media
Creare visual per i social media con testo incorporato, colori del brand e stile coerente su più immagini della campagna -- specificare il testo esatto nel prompt.
Still cinematografici per la conversione video
Generare primi fotogrammi pronti per il video e still cinematografici che possono fungere da keyframe per i workflow di generazione video o illustrazioni editoriali autonome.
Domande su GPT Image + Hermes Agent
Sì. Hermes Agent chiama GPT Image 2 tramite l'endpoint RunAPI text_to_image. Imposta il campo model su gpt-image-2-text-to-image e invia la richiesta con la stessa RUNAPI_API_KEY configurata per il provider custom:runapi. Nessun ComfyUI o GPU in affitto richiesti.
GPT Image 2 è il modello dedicato di OpenAI per la generazione di immagini con qualità superiore, output 4K e supporto per sfondo trasparente. GPT-4o Image genera immagini all'interno di un contesto chat ma è limitato ai rapporti d'aspetto 1:1, 3:2 o 2:3. Entrambi sono disponibili tramite RunAPI — usa gpt-image-2-text-to-image per la generazione autonoma e gpt-4o-image per l'output di immagini integrato nella chat.
Sì. GPT Image 2 può produrre immagini con sfondo trasparente quando indicato nel prompt. Questo è utile per foto di prodotti, loghi ed elementi UI che necessitano di compositing. Descrivi la trasparenza nel prompt — ad esempio, "foto prodotto su sfondo trasparente".
GPT Image 2 è fatturato per immagine in base alla risoluzione di output: 1k, 2k o 4k. GPT-4o Image è fatturato per immagine in base al numero di output — generare 2 o 4 immagini in una singola richiesta costa di più per immagine. Entrambi usano la fatturazione pay-as-you-go senza minimo mensile. Controlla la pagina dei prezzi di RunAPI per le tariffe aggiornate.
Sì. Usa l'endpoint edit_image con model impostato su gpt-image-2-image-to-image. Passa le immagini sorgente in source_image_urls e descrivi la modifica in linguaggio naturale — "rimuovi lo sfondo," "aggiungi occhiali da sole," "cambia il testo in HELLO." Nessun grafico di flusso ComfyUI, nessuna istanza GPU, nessuna maschera di inpainting necessaria.
Configurazione generale di Hermes Agent
Non ancora configurato? Inizia con la guida di configurazione RunAPI per Hermes Agent.
Guida di configurazione di Hermes Agent →Catalogo modelli GPT Image
Vedi tutte le varianti, i prezzi e la documentazione API di GPT Image.
Modelli GPT Image →Prova GPT Image in Hermes Agent oggi.
Ottieni una API key RunAPI gratuita, configura il provider custom:runapi e inizia a generare e modificare immagini con OpenAI GPT Image 2.