Usa GPT Image en Hermes Agent.
GPT Image 2 de OpenAI genera imágenes fotorrealistas con renderizado preciso de texto a través del endpoint text_to_image de RunAPI. Hermes Agent lo llama mediante el proveedor custom:runapi — la misma clave y URL base configuradas para chat. Admite tamaños de 1024x1024 a 1536x1024 y niveles de calidad de low a high. Las tareas son asíncronas — consulta el task_id hasta completar.
Usa RunAPI para generar una imagen con GPT Image 2 a través de Hermes Agent.
Requisitos:
- Usa el proveedor custom:runapi ya configurado en Hermes Agent
- Llama al endpoint text_to_image de RunAPI en https://runapi.ai/v1/text_to_image
- Establece model en "gpt-image-2-text-to-image"
- La variable de entorno RUNAPI_API_KEY proporciona la autorización
- Opcionalmente establece size (1024x1024, 1536x1024, 1024x1536) y quality (low, medium, high, auto)
- La respuesta es asíncrona — consulta el task_id devuelto hasta que el estado sea completado
curl -X POST https://runapi.ai/v1/text_to_image \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-image-2-text-to-image",
"prompt": "A minimalist product photo of a glass water bottle on a white marble surface, soft natural light",
"size": "1024x1024",
"quality": "high"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "gpt-image-2-text-to-image"
}
Usa GPT Image en Hermes Agent en tres pasos
Configura RunAPI
Establece la variable de entorno RUNAPI_API_KEY. Si ya añadiste RunAPI como proveedor custom:runapi en Hermes Agent para chat, la misma clave y base_url funcionan para GPT Image — no se necesita configuración adicional.
export RUNAPI_API_KEY=runapi_xxx
Llama a GPT Image
Envía un POST al endpoint text_to_image con model establecido en gpt-image-2-text-to-image. Incluye un prompt descriptivo. Opcionalmente establece size (1024x1024, 1536x1024 o 1024x1536) y quality (low, medium, high o auto). Para edición de imagen a imagen, usa el endpoint image_to_image con una source_image_url.
POST /v1/text_to_image
Obtén el resultado
El endpoint devuelve un task_id con estado pendiente. Consulta el endpoint de estado de la tarea hasta que el estado cambie a completado y luego recupera la URL de la imagen generada de la respuesta.
task_id: tsk_abc123
Parámetros de la API de GPT Image
| Parâmetro | Tipo | Descrição |
|---|---|---|
model |
string |
Obligatorio. gpt-image-2-text-to-image, gpt-image-1.5-text-to-image, gpt-image-2-image-to-image o gpt-image-1.5-image-to-image. |
prompt |
string |
Descripción de texto de la imagen a generar. |
size |
string |
Opcional. Dimensiones de salida: 1024x1024, 1536x1024 o 1024x1536. |
quality |
string |
Opcional. Nivel de calidad de la imagen — low, medium, high o auto. Afecta al coste por imagen. |
source_image_url |
string |
Obligatorio para image_to_image. URL de la imagen de entrada para editar o transformar. |
callback_url |
string |
Opcional. URL de webhook para notificación de finalización asíncrona. |
O que é GPT Image no Hermes Agent?
GPT Image 2 trata prompts como briefs de produção em vez de listas soltas de palavras-chave. Hermes Agent o chama via RunAPI custom provider para geração precisa de imagens em workflows de design automatizados.
Casos de uso do GPT Image
Fotografia de produto com fundos transparentes
Gere fotos de produto em fundos transparentes para composição em materiais de marketing.
Gráficos de campanha para redes sociais
Crie visuais de redes sociais com texto incorporado, cores de marca e elementos específicos de campanha.
Frames cinematográficos para conversão em vídeo
Gere primeiros frames prontos para vídeo e frames cinematográficos para pipelines de animação.
Preguntas sobre GPT Image + Hermes Agent
Sí. Envía un POST al endpoint text_to_image con model establecido en gpt-image-2-text-to-image o gpt-image-1.5-text-to-image. El mismo proveedor custom:runapi y RUNAPI_API_KEY que usas para chat gestionan también la generación de imágenes.
GPT Image 2 ofrece mejor precisión en renderizado de texto, mayor consistencia y una gama más amplia de opciones de calidad (low, medium, high, auto). GPT Image 1.5 es la variante anterior. Ambos admiten texto a imagen e imagen a imagen.
GPT Image se factura por imagen. El coste varía según el nivel de calidad seleccionado — low, medium, high o auto. Auto selecciona la calidad según el prompt. Consulta la página de precios de RunAPI para las tarifas actuales.
Sí. Usa gpt-image-2-image-to-image con el endpoint image_to_image. Pasa una source_image_url y un prompt de texto. El modelo combina la imagen de entrada con el prompt para producir el resultado editado.
No. La misma RUNAPI_API_KEY y base_url del proveedor custom:runapi funcionan para GPT Image, GPT chat y todos los demás modelos de RunAPI. Solo cambia el endpoint y el parámetro model según lo que generas.
Configuración general de Hermes Agent
¿Aún no lo has configurado? Empieza con la guía de configuración de RunAPI para Hermes Agent.
Guía de configuración de Hermes Agent →Catálogo de modelos GPT Image
Ver todas las variantes de GPT Image, precios y documentación de la API.
GPT Image en RunAPI →Prueba GPT Image en Hermes Agent hoy.
Obtén una clave RunAPI gratuita, configura el proveedor custom:runapi y empieza a generar imágenes con GPT Image 2 desde Hermes Agent.