HERMES + GPT IMAGE

Usa GPT Image in Hermes Agent.

GPT Image 2 è il modello dedicato di OpenAI per la generazione di immagini — text-to-image e modifica immagini basata su istruzioni con risoluzione di output fino a 4K e supporto per sfondo trasparente. Hermes Agent lo chiama tramite lo stesso provider custom RunAPI e la stessa API key usati per la chat, senza necessità di ComfyUI o GPU.

una API key · text to image + modifica immagini · output fino a 4K
Usa RunAPI per generare un'immagine con OpenAI GPT Image 2 da Hermes Agent.

Requisiti:
- Usa l'API RunAPI su https://runapi.ai/v1/text_to_image.
- Leggi la API key dalla variabile d'ambiente RUNAPI_API_KEY.
- Usa il provider custom:runapi già configurato in Hermes Agent.
- Imposta il model su "gpt-image-2-text-to-image".
- Scrivi un prompt descrittivo. GPT Image 2 segue attentamente le istruzioni in linguaggio naturale — descrivi layout, stile, sovrapposizioni di testo e necessità di trasparenza.
- Facoltativamente imposta output_resolution su 1k, 2k o 4k. Il valore predefinito è 1k.
- La risposta restituisce un task_id. Esegui il polling dell'endpoint di stato del task finché il task non viene completato, poi recupera l'URL di output.
curl -X POST https://runapi.ai/v1/text_to_image \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2-text-to-image",
    "prompt": "A product photo of a glass perfume bottle on a marble surface, transparent background, studio lighting, the label reads AURORA in gold serif font",
    "output_resolution": "2k",
    "aspect_ratio": "3:4"
  }'
{
  "task_id": "tsk_abc123",
  "status": "pending",
  "model": "gpt-image-2-text-to-image"
}
Copia il comando curl per testare gpt-image
COME FUNZIONA

Usa GPT Image in Hermes Agent in tre passaggi

1

Configura RunAPI

Imposta la variabile d'ambiente RUNAPI_API_KEY nel tuo profilo shell. Se il provider custom:runapi è già configurato in Hermes Agent per la chat, la stessa key e base_url funzionano per GPT Image — nessuna configurazione aggiuntiva necessaria.

export RUNAPI_API_KEY=runapi_xxx
2

Chiama GPT Image 2

Invia una richiesta POST all'endpoint text_to_image con model impostato su gpt-image-2-text-to-image. Includi un prompt descrittivo con istruzioni di layout e stile. Imposta output_resolution su 2k o 4k per maggiore dettaglio. Per modificare immagini esistenti, usa l'endpoint edit_image con gpt-image-2-image-to-image e fornisci source_image_urls.

POST /v1/text_to_image
3

Ottieni il risultato

L'API restituisce immediatamente un task_id. Esegui il polling dell'endpoint di stato del task finché lo stato non cambia in completed, poi recupera l'URL dell'immagine di output dalla risposta. GPT Image 2 in genere completa entro 10–30 secondi a seconda della risoluzione.

task_id: tsk_abc123
PARAMETRI

Parametri API GPT Image

Parametro Tipo Descrizione
model string Obbligatorio. gpt-image-2-text-to-image per la generazione, gpt-image-2-image-to-image per la modifica.
prompt string Obbligatorio. Descrizione in linguaggio naturale dell'immagine desiderata. Supporta istruzioni dettagliate per layout, sovrapposizioni di testo e stile.
output_resolution string Facoltativo. Risoluzione di output — 1k (predefinito), 2k o 4k. Una risoluzione più alta costa di più per immagine.
aspect_ratio string Facoltativo. Il valore predefinito è auto. Supporta 1:1, 3:2, 2:3, 4:3, 3:4, 16:9, 9:16 e altro.
source_image_urls array Obbligatorio per l'endpoint edit_image. Uno o più URL di immagini sorgente da modificare.

Cos'è GPT Image su Hermes Agent?

GPT Image 2 tratta i prompt come brief di produzione piuttosto che come elenchi di parole chiave vaghe. Include un passaggio di ragionamento prima della generazione, che lo aiuta a seguire istruzioni strutturate per il layout, il posizionamento del testo e la composizione. Gli utenti trovano che funziona meglio con prompt più semplici e chiaramente strutturati -- i raffinamenti complessi multi-passaggio possono introdurre pattern di rumore. Hermes Agent lo chiama tramite il provider personalizzato RunAPI.

Casi d'uso di GPT Image

Fotografia di prodotti con sfondi trasparenti

Generare foto di prodotti su sfondi trasparenti per il compositing in materiali di marketing, cataloghi o listini e-commerce senza mascheratura manuale.

Grafiche per campagne sui social media

Creare visual per i social media con testo incorporato, colori del brand e stile coerente su più immagini della campagna -- specificare il testo esatto nel prompt.

Still cinematografici per la conversione video

Generare primi fotogrammi pronti per il video e still cinematografici che possono fungere da keyframe per i workflow di generazione video o illustrazioni editoriali autonome.

FAQ

Domande su GPT Image + Hermes Agent

Configurazione generale di Hermes Agent

Non ancora configurato? Inizia con la guida di configurazione RunAPI per Hermes Agent.

Guida di configurazione di Hermes Agent →

Catalogo modelli GPT Image

Vedi tutte le varianti, i prezzi e la documentazione API di GPT Image.

Modelli GPT Image →

Prova GPT Image in Hermes Agent oggi.

Ottieni una API key RunAPI gratuita, configura il provider custom:runapi e inizia a generare e modificare immagini con OpenAI GPT Image 2.