Usa GPT Image en Hermes Agent.
GPT Image 2 de OpenAI genera imágenes fotorrealistas con renderizado preciso de texto a través del endpoint text_to_image de RunAPI. Hermes Agent lo llama mediante el proveedor custom:runapi — la misma clave y URL base configuradas para chat. Admite tamaños de 1024x1024 a 1536x1024 y niveles de calidad de low a high. Las tareas son asíncronas — consulta el task_id hasta completar.
Usa RunAPI para generar una imagen con GPT Image 2 a través de Hermes Agent.
Requisitos:
- Usa el proveedor custom:runapi ya configurado en Hermes Agent
- Llama al endpoint text_to_image de RunAPI en https://runapi.ai/v1/text_to_image
- Establece model en "gpt-image-2-text-to-image"
- La variable de entorno RUNAPI_API_KEY proporciona la autorización
- Opcionalmente establece size (1024x1024, 1536x1024, 1024x1536) y quality (low, medium, high, auto)
- La respuesta es asíncrona — consulta el task_id devuelto hasta que el estado sea completado
curl -X POST https://runapi.ai/v1/text_to_image \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-image-2-text-to-image",
"prompt": "A minimalist product photo of a glass water bottle on a white marble surface, soft natural light",
"size": "1024x1024",
"quality": "high"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "gpt-image-2-text-to-image"
}
Usa GPT Image en Hermes Agent en tres pasos
Configura RunAPI
Establece la variable de entorno RUNAPI_API_KEY. Si ya añadiste RunAPI como proveedor custom:runapi en Hermes Agent para chat, la misma clave y base_url funcionan para GPT Image — no se necesita configuración adicional.
export RUNAPI_API_KEY=runapi_xxx
Llama a GPT Image
Envía un POST al endpoint text_to_image con model establecido en gpt-image-2-text-to-image. Incluye un prompt descriptivo. Opcionalmente establece size (1024x1024, 1536x1024 o 1024x1536) y quality (low, medium, high o auto). Para edición de imagen a imagen, usa el endpoint image_to_image con una source_image_url.
POST /v1/text_to_image
Obtén el resultado
El endpoint devuelve un task_id con estado pendiente. Consulta el endpoint de estado de la tarea hasta que el estado cambie a completado y luego recupera la URL de la imagen generada de la respuesta.
task_id: tsk_abc123
Parámetros de la API de GPT Image
| Parámetro | Tipo | Descripción |
|---|---|---|
model |
string |
Obligatorio. gpt-image-2-text-to-image, gpt-image-1.5-text-to-image, gpt-image-2-image-to-image o gpt-image-1.5-image-to-image. |
prompt |
string |
Descripción de texto de la imagen a generar. |
size |
string |
Opcional. Dimensiones de salida: 1024x1024, 1536x1024 o 1024x1536. |
quality |
string |
Opcional. Nivel de calidad de la imagen — low, medium, high o auto. Afecta al coste por imagen. |
source_image_url |
string |
Obligatorio para image_to_image. URL de la imagen de entrada para editar o transformar. |
callback_url |
string |
Opcional. URL de webhook para notificación de finalización asíncrona. |
¿Qué es GPT Image en Hermes Agent?
GPT Image 2 trata los prompts como briefs de producción en lugar de listas de palabras clave sueltas. Incluye un paso de razonamiento antes de generar, lo que le ayuda a seguir instrucciones estructuradas para diseño, colocación de texto y composición. Los usuarios encuentran que funciona mejor con prompts más simples y claramente estructurados -- los refinamientos complejos de múltiples pasadas pueden introducir patrones de ruido. Hermes Agent lo llama a través del proveedor personalizado de RunAPI.
Casos de uso de GPT Image
Fotografía de productos con fondos transparentes
Generar fotos de productos sobre fondos transparentes para composición en materiales de marketing, catálogos o listados e-commerce sin enmascaramiento manual.
Gráficos para campañas en redes sociales
Crear visuales para redes sociales con texto incrustado, colores de marca y estilo consistente en múltiples imágenes de campaña -- especificar el texto exacto en el prompt.
Imágenes fijas cinematográficas para conversión a video
Generar primeros fotogramas listos para video e imágenes fijas cinematográficas que pueden servir como fotogramas clave para flujos de trabajo de generación de video o ilustraciones editoriales independientes.
Preguntas sobre GPT Image + Hermes Agent
Sí. Envía un POST al endpoint text_to_image con model establecido en gpt-image-2-text-to-image o gpt-image-1.5-text-to-image. El mismo proveedor custom:runapi y RUNAPI_API_KEY que usas para chat gestionan también la generación de imágenes.
GPT Image 2 ofrece mejor precisión en renderizado de texto, mayor consistencia y una gama más amplia de opciones de calidad (low, medium, high, auto). GPT Image 1.5 es la variante anterior. Ambos admiten texto a imagen e imagen a imagen.
GPT Image se factura por imagen. El coste varía según el nivel de calidad seleccionado — low, medium, high o auto. Auto selecciona la calidad según el prompt. Consulta la página de precios de RunAPI para las tarifas actuales.
Sí. Usa gpt-image-2-image-to-image con el endpoint image_to_image. Pasa una source_image_url y un prompt de texto. El modelo combina la imagen de entrada con el prompt para producir el resultado editado.
No. La misma RUNAPI_API_KEY y base_url del proveedor custom:runapi funcionan para GPT Image, GPT chat y todos los demás modelos de RunAPI. Solo cambia el endpoint y el parámetro model según lo que generas.
Configuración general de Hermes Agent
¿Aún no lo has configurado? Empieza con la guía de configuración de RunAPI para Hermes Agent.
Guía de configuración de Hermes Agent →Catálogo de modelos GPT Image
Ver todas las variantes de GPT Image, precios y documentación de la API.
GPT Image en RunAPI →Prueba GPT Image en Hermes Agent hoy.
Obtén una clave RunAPI gratuita, configura el proveedor custom:runapi y empieza a generar imágenes con GPT Image 2 desde Hermes Agent.