Utiliser GPT Image dans OpenClaw.
GPT Image 2 est le modèle de génération d'images dédié d'OpenAI — text-to-image et édition d'images par instruction avec jusqu'à 4K de résolution de sortie et prise en charge des fonds transparents. Deux endpoints RunAPI — gpt-image-2-text-to-image et gpt-image-2-image-to-image — accessibles avec une seule clé RunAPI depuis OpenClaw.
Utilisez RunAPI pour générer une image avec GPT Image 2.
Exigences :
- Utiliser l'endpoint POST /api/v1/gpt_image_2/image_generations de RunAPI
- Définir model sur "gpt-image-2-text-to-image" pour la génération depuis texte ou "gpt-image-2-image-to-image" pour l'édition d'image par instruction
- Utiliser la variable d'environnement RUNAPI_API_KEY pour l'autorisation
- size contrôle la résolution : 1024x1024, 1536x1024, 1024x1536, ou auto pour la 4K
- La tâche est asynchrone — interroger le statut jusqu'à ce que la réponse contienne l'URL de l'image
curl -X POST https://runapi.ai/api/v1/gpt_image_2/image_generations \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-image-2-text-to-image",
"prompt": "A sleek smartwatch on a wrist against a city skyline background, professional product photography, vivid colors, sharp detail",
"size": "1024x1024"
}'
{
"task_id": "gpi_jkl678",
"status": "completed",
"image_url": "https://cdn.runapi.ai/outputs/gpi_jkl678.png",
"model": "gpt-image-2-text-to-image",
"usage": {
"credits": 12
}
}
Utiliser GPT Image dans OpenClaw en trois étapes
Configurer RunAPI
Définissez la variable d'environnement RUNAPI_API_KEY. Si vous avez déjà ajouté RunAPI comme fournisseur dans OpenClaw, la même clé s'applique à GPT Image 2.
export RUNAPI_API_KEY=runapi_xxx
Appeler la génération d'images GPT Image 2
Envoyez une requête POST à /api/v1/gpt_image_2/image_generations avec le model défini sur gpt-image-2-text-to-image et votre prompt. Définissez size sur auto pour la résolution 4K maximale. Pour l'édition d'image, passez gpt-image-2-image-to-image avec image_url.
POST /api/v1/gpt_image_2/image_generations
Récupérer l'image
La tâche est asynchrone — RunAPI retourne un task_id. Interrogez l'endpoint de statut jusqu'à ce que status soit completed, puis utilisez image_url pour récupérer l'image générée.
task.image_url
Paramètres API de génération d'images GPT Image 2
| Paramètre | Type | Description |
|---|---|---|
model |
string |
Requis. gpt-image-2-text-to-image pour la génération depuis texte ou gpt-image-2-image-to-image pour l'édition par instruction. |
prompt |
string |
Requis. Description textuelle de l'image à générer ou de la modification à apporter. |
size |
string |
Optionnel. Résolution de sortie : 1024x1024, 1536x1024, 1024x1536, ou auto pour la 4K. |
image_url |
string |
Requis pour gpt-image-2-image-to-image. URL de l'image source à modifier. |
Qu'est-ce que GPT Image sur OpenClaw ?
GPT Image 2 est le modèle d'image dédié d'OpenAI qui fonctionne davantage comme un assistant de design structuré que comme un générateur piloté par mots-clés. Vous lui donnez un brief de production -- mise en page, placement du texte, contraintes de style -- et il suit les instructions de près. Les utilisateurs rapportent une forte cohérence des personnages, un rendu de texte propre et des mises en page lisibles, bien que la qualité puisse se dégrader à travers plusieurs passes de raffinement itératif. Les agents OpenClaw l'appellent via le même endpoint RunAPI utilisé pour le chat.
Cas d'utilisation de GPT Image
Maquettes UI et wireframes de design d'application
Générer des maquettes UI détaillées à partir de descriptions écrites, incluant les mises en page de boutons, les barres de navigation et le contenu de remplacement qui se lisent correctement.
Affiches riches en texte et présentations
Créer des affiches à texte exact, des infographies et des diapositives de présentation où le contenu textuel est spécifié dans le prompt et rendu avec des mises en page propres et lisibles.
Feuilles de design de personnages
Générer des feuilles de design de personnages avec des vues en rotation à partir d'une seule description, maintenant des caractéristiques cohérentes sur plusieurs angles.
Questions sur GPT Image + OpenClaw
GPT Image 2 est le modèle de génération d'images dédié d'OpenAI, distinct de GPT-4o. Il offre jusqu'à 4K de résolution de sortie, la prise en charge des fonds transparents et l'édition d'images par instruction. GPT-4o Image est un modèle distinct avec des capacités visuelles différentes.
GPT Image 2 prend en charge la génération de fonds transparents — idéal pour les logos, icônes et assets produits qui doivent être superposés sur d'autres visuels. Spécifiez background transparent dans votre prompt ou utilisez le paramètre dédié si disponible.
GPT Image 2 est facturé par image générée sur RunAPI avec une tarification pay-as-you-go. Les images 4K coûtent plus que les résolutions standard. Consultez la page de tarification RunAPI pour les tarifs actuels par résolution.
Oui. L'endpoint gpt-image-2-image-to-image prend une image source et une instruction de modification en langage naturel. C'est adapté pour modifier les couleurs, le style, ajouter des éléments ou changer l'arrière-plan d'une image existante.
Oui. La génération est asynchrone. RunAPI retourne immédiatement un task_id ; interrogez l'endpoint de statut jusqu'à ce que status soit completed. OpenClaw peut enchaîner ce polling automatiquement.
Configuration générale de OpenClaw
Pas encore configuré ? Commencez par le guide de configuration RunAPI pour OpenClaw.
Guide de configuration OpenClaw →Catalogue des modèles GPT Image
Voir toutes les variantes GPT Image 2, les niveaux de tarification et la documentation API.
Modèles GPT Image →Essayez GPT Image dans OpenClaw dès aujourd'hui.
Obtenez une clé RunAPI gratuite et commencez à générer des images GPT Image 2 depuis OpenClaw — jusqu'à 4K avec fond transparent.