Utiliser GPT Image dans Hermes Agent.
GPT Image 2 est le modèle de génération d'images dédié d'OpenAI — text-to-image et édition par instruction avec jusqu'à 4K de résolution et prise en charge des fonds transparents. Hermes Agent accède aux deux endpoints RunAPI — gpt-image-2-text-to-image et gpt-image-2-image-to-image — pour orchestrer des workflows complets de génération et d'édition d'images.
Utilisez RunAPI pour générer une image avec GPT Image 2 via Hermes Agent.
Exigences :
- Appeler l'endpoint POST /api/v1/gpt_image_2/image_generations de RunAPI
- Définir model sur "gpt-image-2-text-to-image" pour la génération depuis texte ou "gpt-image-2-image-to-image" pour l'édition d'image par instruction
- Utiliser la variable d'environnement RUNAPI_API_KEY pour l'autorisation
- size contrôle la résolution : 1024x1024, 1536x1024, 1024x1536, ou auto pour la 4K
- La tâche est asynchrone — interroger le statut jusqu'à ce que la réponse contienne l'URL de l'image
curl -X POST https://runapi.ai/api/v1/gpt_image_2/image_generations \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-image-2-text-to-image",
"prompt": "A sleek smartwatch on a wrist against a city skyline background, professional product photography, vivid colors, sharp detail",
"size": "1024x1024"
}'
{
"task_id": "gpi_jkl678",
"status": "completed",
"image_url": "https://cdn.runapi.ai/outputs/gpi_jkl678.png",
"model": "gpt-image-2-text-to-image",
"usage": {
"credits": 12
}
}
Utiliser GPT Image dans Hermes Agent en trois étapes
Configurer RunAPI
Définissez la variable d'environnement RUNAPI_API_KEY. Si vous avez déjà ajouté RunAPI comme fournisseur dans Hermes Agent, la même clé s'applique à GPT Image 2.
export RUNAPI_API_KEY=runapi_xxx
Appeler la génération d'images GPT Image 2
Envoyez une requête POST à /api/v1/gpt_image_2/image_generations avec le model défini sur gpt-image-2-text-to-image et votre prompt. Hermes Agent peut appeler cet endpoint directement depuis ses capacités d'utilisation d'outils. Pour l'édition, passez gpt-image-2-image-to-image avec image_url et prompt d'instruction.
POST /api/v1/gpt_image_2/image_generations
Récupérer l'image
La tâche est asynchrone — RunAPI retourne un task_id. Hermes Agent interroge le statut jusqu'à completion et récupère l'image_url pour la transmettre à la prochaine étape du workflow ou la retourner à l'utilisateur.
task.image_url
Paramètres API de génération d'images GPT Image 2
| Paramètre | Type | Description |
|---|---|---|
model |
string |
Requis. gpt-image-2-text-to-image pour la génération depuis texte ou gpt-image-2-image-to-image pour l'édition par instruction. |
prompt |
string |
Requis. Description textuelle de l'image à générer ou de la modification à apporter. |
size |
string |
Optionnel. Résolution de sortie : 1024x1024, 1536x1024, 1024x1536, ou auto pour la 4K. |
image_url |
string |
Requis pour gpt-image-2-image-to-image. URL de l'image source à modifier. |
Qu'est-ce que GPT Image sur Hermes Agent ?
GPT Image 2 traite les prompts comme des briefs de production plutôt que comme des listes de mots-clés vagues. Il inclut une étape de raisonnement avant la génération, qui l'aide à suivre des instructions structurées pour la mise en page, le placement du texte et la composition. Les utilisateurs trouvent qu'il fonctionne mieux avec des prompts plus simples et clairement structurés -- les raffinements complexes multi-passes peuvent introduire des patterns de bruit. Hermes Agent l'appelle via le fournisseur personnalisé RunAPI.
Cas d'utilisation de GPT Image
Photographie produit avec arrière-plans transparents
Générer des photos produit sur des arrière-plans transparents pour la composition dans des matériaux marketing, des catalogues ou des listings e-commerce sans masquage manuel.
Graphiques pour campagnes sur les réseaux sociaux
Créer des visuels pour les réseaux sociaux avec du texte intégré, des couleurs de marque et un style cohérent sur plusieurs images de campagne -- spécifier le texte exact dans le prompt.
Stills cinématographiques pour conversion vidéo
Générer des premiers plans prêts pour la vidéo et des stills cinématographiques pouvant servir d'images clés pour les workflows de génération vidéo ou d'illustrations éditoriales autonomes.
Questions sur GPT Image + Hermes Agent
Hermes Agent peut orchestrer des workflows de génération d'images avec GPT Image 2 — générer des images de produits, créer des variations de marque ou produire des assets marketing. GPT Image 2 prend en charge la 4K et les fonds transparents, ce qui le rend adapté pour les assets qui seront utilisés dans d'autres visuels.
GPT Image 2 est le modèle de génération d'images dédié d'OpenAI avec édition par instruction, résolution jusqu'à 4K et prise en charge des fonds transparents. GPT-4o Image est un modèle distinct avec des capacités visuelles multimodales différentes. Les deux sont disponibles sur RunAPI.
Oui. L'endpoint gpt-image-2-image-to-image permet à Hermes Agent de modifier des images existantes via des instructions en langage naturel. Utile pour des workflows où l'agent génère d'abord une image de base, puis l'affine selon les retours utilisateurs ou les critères de workflow.
GPT Image 2 est facturé par image générée sur RunAPI. Les images 4K coûtent plus que les résolutions standard. Consultez la page de tarification RunAPI pour les tarifs actuels par résolution.
Oui. La génération est asynchrone. RunAPI retourne immédiatement un task_id. Hermes Agent peut interroger le statut et récupérer l'image_url quand elle est prête, puis la passer à la prochaine étape du workflow ou la retourner à l'utilisateur.
Configuration générale de Hermes Agent
Pas encore configuré ? Commencez par le guide de configuration RunAPI pour Hermes Agent.
Guide de configuration Hermes Agent →Catalogue des modèles GPT Image
Voir toutes les variantes GPT Image 2, les niveaux de tarification et la documentation API.
Modèles GPT Image →Essayez GPT Image dans Hermes Agent dès aujourd'hui.
Obtenez une clé RunAPI gratuite et commencez à générer des images GPT Image 2 dans Hermes Agent — jusqu'à 4K avec fond transparent.