HERMES + GPT IMAGE

Utiliser GPT Image dans Hermes Agent.

GPT Image 2 est le modèle de génération d'images dédié d'OpenAI — text-to-image et édition par instruction avec jusqu'à 4K de résolution et prise en charge des fonds transparents. Hermes Agent accède aux deux endpoints RunAPI — gpt-image-2-text-to-image et gpt-image-2-image-to-image — pour orchestrer des workflows complets de génération et d'édition d'images.

une seule clé API · résolution 4K · prise en charge des fonds transparents
Utilisez RunAPI pour générer une image avec GPT Image 2 via Hermes Agent.


  Exigences :

  - Appeler l'endpoint POST /api/v1/gpt_image_2/image_generations de RunAPI

  - Définir model sur "gpt-image-2-text-to-image" pour la génération depuis texte ou "gpt-image-2-image-to-image" pour l'édition d'image par instruction

  - Utiliser la variable d'environnement RUNAPI_API_KEY pour l'autorisation

  - size contrôle la résolution : 1024x1024, 1536x1024, 1024x1536, ou auto pour la 4K

  - La tâche est asynchrone — interroger le statut jusqu'à ce que la réponse contienne l'URL de l'image

  
curl -X POST https://runapi.ai/api/v1/gpt_image_2/image_generations \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2-text-to-image",
    "prompt": "A sleek smartwatch on a wrist against a city skyline background, professional product photography, vivid colors, sharp detail",
    "size": "1024x1024"
  }'
{
  "task_id": "gpi_jkl678",
  "status": "completed",
  "image_url": "https://cdn.runapi.ai/outputs/gpi_jkl678.png",
  "model": "gpt-image-2-text-to-image",
  "usage": {
    "credits": 12
  }
}
Copiez la commande curl pour tester gpt-image
FONCTIONNEMENT

Utiliser GPT Image dans Hermes Agent en trois étapes

1

Configurer RunAPI

Définissez la variable d'environnement RUNAPI_API_KEY. Si vous avez déjà ajouté RunAPI comme fournisseur dans Hermes Agent, la même clé s'applique à GPT Image 2.

export RUNAPI_API_KEY=runapi_xxx
2

Appeler la génération d'images GPT Image 2

Envoyez une requête POST à /api/v1/gpt_image_2/image_generations avec le model défini sur gpt-image-2-text-to-image et votre prompt. Hermes Agent peut appeler cet endpoint directement depuis ses capacités d'utilisation d'outils. Pour l'édition, passez gpt-image-2-image-to-image avec image_url et prompt d'instruction.

POST /api/v1/gpt_image_2/image_generations
3

Récupérer l'image

La tâche est asynchrone — RunAPI retourne un task_id. Hermes Agent interroge le statut jusqu'à completion et récupère l'image_url pour la transmettre à la prochaine étape du workflow ou la retourner à l'utilisateur.

task.image_url
PARAMÈTRES

Paramètres API de génération d'images GPT Image 2

Paramètre Type Description
model string Requis. gpt-image-2-text-to-image pour la génération depuis texte ou gpt-image-2-image-to-image pour l'édition par instruction.
prompt string Requis. Description textuelle de l'image à générer ou de la modification à apporter.
size string Optionnel. Résolution de sortie : 1024x1024, 1536x1024, 1024x1536, ou auto pour la 4K.
image_url string Requis pour gpt-image-2-image-to-image. URL de l'image source à modifier.

Qu'est-ce que GPT Image sur Hermes Agent ?

GPT Image 2 traite les prompts comme des briefs de production plutôt que comme des listes de mots-clés vagues. Il inclut une étape de raisonnement avant la génération, qui l'aide à suivre des instructions structurées pour la mise en page, le placement du texte et la composition. Les utilisateurs trouvent qu'il fonctionne mieux avec des prompts plus simples et clairement structurés -- les raffinements complexes multi-passes peuvent introduire des patterns de bruit. Hermes Agent l'appelle via le fournisseur personnalisé RunAPI.

Cas d'utilisation de GPT Image

Photographie produit avec arrière-plans transparents

Générer des photos produit sur des arrière-plans transparents pour la composition dans des matériaux marketing, des catalogues ou des listings e-commerce sans masquage manuel.

Graphiques pour campagnes sur les réseaux sociaux

Créer des visuels pour les réseaux sociaux avec du texte intégré, des couleurs de marque et un style cohérent sur plusieurs images de campagne -- spécifier le texte exact dans le prompt.

Stills cinématographiques pour conversion vidéo

Générer des premiers plans prêts pour la vidéo et des stills cinématographiques pouvant servir d'images clés pour les workflows de génération vidéo ou d'illustrations éditoriales autonomes.

FAQ

Questions sur GPT Image + Hermes Agent

Configuration générale de Hermes Agent

Pas encore configuré ? Commencez par le guide de configuration RunAPI pour Hermes Agent.

Guide de configuration Hermes Agent →

Catalogue des modèles GPT Image

Voir toutes les variantes GPT Image 2, les niveaux de tarification et la documentation API.

Modèles GPT Image →

Essayez GPT Image dans Hermes Agent dès aujourd'hui.

Obtenez une clé RunAPI gratuite et commencez à générer des images GPT Image 2 dans Hermes Agent — jusqu'à 4K avec fond transparent.