HERMES + GPT IMAGE

Usa GPT Image en Hermes Agent.

GPT Image 2 de OpenAI genera imágenes fotorrealistas con renderizado preciso de texto a través del endpoint text_to_image de RunAPI. Hermes Agent lo llama mediante el proveedor custom:runapi — la misma clave y URL base configuradas para chat. Admite tamaños de 1024x1024 a 1536x1024 y niveles de calidad de low a high. Las tareas son asíncronas — consulta el task_id hasta completar.

una clave API · endpoint de texto a imagen · polling de tareas asíncronas
Usa RunAPI para generar una imagen con GPT Image 2 a través de Hermes Agent.


      Requisitos:

      - Usa el proveedor custom:runapi ya configurado en Hermes Agent

      - Llama al endpoint text_to_image de RunAPI en https://runapi.ai/v1/text_to_image

      - Establece model en "gpt-image-2-text-to-image"

      - La variable de entorno RUNAPI_API_KEY proporciona la autorización

      - Opcionalmente establece size (1024x1024, 1536x1024, 1024x1536) y quality (low, medium, high, auto)

      - La respuesta es asíncrona — consulta el task_id devuelto hasta que el estado sea completado

      
curl -X POST https://runapi.ai/v1/text_to_image \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2-text-to-image",
    "prompt": "A minimalist product photo of a glass water bottle on a white marble surface, soft natural light",
    "size": "1024x1024",
    "quality": "high"
  }'
{
  "task_id": "tsk_abc123",
  "status": "pending",
  "model": "gpt-image-2-text-to-image"
}
Copia el comando curl para probarlo gpt-image
CÓMO FUNCIONA

Usa GPT Image en Hermes Agent en tres pasos

1

Configura RunAPI

Establece la variable de entorno RUNAPI_API_KEY. Si ya añadiste RunAPI como proveedor custom:runapi en Hermes Agent para chat, la misma clave y base_url funcionan para GPT Image — no se necesita configuración adicional.

export RUNAPI_API_KEY=runapi_xxx
2

Llama a GPT Image

Envía un POST al endpoint text_to_image con model establecido en gpt-image-2-text-to-image. Incluye un prompt descriptivo. Opcionalmente establece size (1024x1024, 1536x1024 o 1024x1536) y quality (low, medium, high o auto). Para edición de imagen a imagen, usa el endpoint image_to_image con una source_image_url.

POST /v1/text_to_image
3

Obtén el resultado

El endpoint devuelve un task_id con estado pendiente. Consulta el endpoint de estado de la tarea hasta que el estado cambie a completado y luego recupera la URL de la imagen generada de la respuesta.

task_id: tsk_abc123
PARÁMETROS

Parámetros de la API de GPT Image

Parámetro Tipo Descripción
model string Obligatorio. gpt-image-2-text-to-image, gpt-image-1.5-text-to-image, gpt-image-2-image-to-image o gpt-image-1.5-image-to-image.
prompt string Descripción de texto de la imagen a generar.
size string Opcional. Dimensiones de salida: 1024x1024, 1536x1024 o 1024x1536.
quality string Opcional. Nivel de calidad de la imagen — low, medium, high o auto. Afecta al coste por imagen.
source_image_url string Obligatorio para image_to_image. URL de la imagen de entrada para editar o transformar.
callback_url string Opcional. URL de webhook para notificación de finalización asíncrona.

¿Qué es GPT Image en Hermes Agent?

GPT Image 2 trata los prompts como briefs de producción en lugar de listas de palabras clave sueltas. Incluye un paso de razonamiento antes de generar, lo que le ayuda a seguir instrucciones estructuradas para diseño, colocación de texto y composición. Los usuarios encuentran que funciona mejor con prompts más simples y claramente estructurados -- los refinamientos complejos de múltiples pasadas pueden introducir patrones de ruido. Hermes Agent lo llama a través del proveedor personalizado de RunAPI.

Casos de uso de GPT Image

Fotografía de productos con fondos transparentes

Generar fotos de productos sobre fondos transparentes para composición en materiales de marketing, catálogos o listados e-commerce sin enmascaramiento manual.

Gráficos para campañas en redes sociales

Crear visuales para redes sociales con texto incrustado, colores de marca y estilo consistente en múltiples imágenes de campaña -- especificar el texto exacto en el prompt.

Imágenes fijas cinematográficas para conversión a video

Generar primeros fotogramas listos para video e imágenes fijas cinematográficas que pueden servir como fotogramas clave para flujos de trabajo de generación de video o ilustraciones editoriales independientes.

FAQ

Preguntas sobre GPT Image + Hermes Agent

Configuración general de Hermes Agent

¿Aún no lo has configurado? Empieza con la guía de configuración de RunAPI para Hermes Agent.

Guía de configuración de Hermes Agent →

Catálogo de modelos GPT Image

Ver todas las variantes de GPT Image, precios y documentación de la API.

GPT Image en RunAPI →

Prueba GPT Image en Hermes Agent hoy.

Obtén una clave RunAPI gratuita, configura el proveedor custom:runapi y empieza a generar imágenes con GPT Image 2 desde Hermes Agent.