¿Puedo generar imágenes con GPT Image desde Hermes Agent?

Sí. Envía un POST al endpoint text_to_image con model establecido en gpt-image-2-text-to-image o gpt-image-1.5-text-to-image. El mismo proveedor custom:runapi y RUNAPI_API_KEY que usas para chat gestionan también la generación de imágenes.

¿Cuál es la diferencia entre GPT Image 2 y GPT Image 1.5?

GPT Image 2 ofrece mejor precisión en renderizado de texto, mayor consistencia y una gama más amplia de opciones de calidad (low, medium, high, auto). GPT Image 1.5 es la variante anterior. Ambos admiten texto a imagen e imagen a imagen.

¿Cómo se factura GPT Image en RunAPI?

GPT Image se factura por imagen. El coste varía según el nivel de calidad seleccionado — low, medium, high o auto. Auto selecciona la calidad según el prompt. Consulta la página de precios de RunAPI para las tarifas actuales.

¿GPT Image admite edición de imágenes de imagen a imagen?

Sí. Usa gpt-image-2-image-to-image con el endpoint image_to_image. Pasa una source_image_url y un prompt de texto. El modelo combina la imagen de entrada con el prompt para producir el resultado editado.

¿Necesito una configuración de proveedor separada para GPT Image?

No. La misma RUNAPI_API_KEY y base_url del proveedor custom:runapi funcionan para GPT Image, GPT chat y todos los demás modelos de RunAPI. Solo cambia el endpoint y el parámetro model según lo que generas.

HERMES + GPT IMAGE

Usa GPT Image en Hermes Agent.

GPT Image 2 de OpenAI genera imágenes fotorrealistas con renderizado preciso de texto a través del endpoint text_to_image de RunAPI. Hermes Agent lo llama mediante el proveedor custom:runapi — la misma clave y URL base configuradas para chat. Admite tamaños de 1024x1024 a 1536x1024 y niveles de calidad de low a high. Las tareas son asíncronas — consulta el task_id hasta completar.

Obtener API Key Leer la documentación

una clave API · endpoint de texto a imagen · polling de tareas asíncronas

Usa RunAPI para generar una imagen con GPT Image 2 a través de Hermes Agent.


      Requisitos:

      - Usa el proveedor custom:runapi ya configurado en Hermes Agent

      - Llama al endpoint text_to_image de RunAPI en https://runapi.ai/v1/text_to_image

      - Establece model en "gpt-image-2-text-to-image"

      - La variable de entorno RUNAPI_API_KEY proporciona la autorización

      - Opcionalmente establece size (1024x1024, 1536x1024, 1024x1536) y quality (low, medium, high, auto)

      - La respuesta es asíncrona — consulta el task_id devuelto hasta que el estado sea completado

curl -X POST https://runapi.ai/v1/text_to_image \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2-text-to-image",
    "prompt": "A minimalist product photo of a glass water bottle on a white marble surface, soft natural light",
    "size": "1024x1024",
    "quality": "high"
  }'

{
  "task_id": "tsk_abc123",
  "status": "pending",
  "model": "gpt-image-2-text-to-image"
}

Copia el comando curl para probarlo gpt-image

CÓMO FUNCIONA

Usa GPT Image en Hermes Agent en tres pasos

Configura RunAPI

Establece la variable de entorno RUNAPI_API_KEY. Si ya añadiste RunAPI como proveedor custom:runapi en Hermes Agent para chat, la misma clave y base_url funcionan para GPT Image — no se necesita configuración adicional.

export RUNAPI_API_KEY=runapi_xxx

Llama a GPT Image

Envía un POST al endpoint text_to_image con model establecido en gpt-image-2-text-to-image. Incluye un prompt descriptivo. Opcionalmente establece size (1024x1024, 1536x1024 o 1024x1536) y quality (low, medium, high o auto). Para edición de imagen a imagen, usa el endpoint image_to_image con una source_image_url.

POST /v1/text_to_image

Obtén el resultado

El endpoint devuelve un task_id con estado pendiente. Consulta el endpoint de estado de la tarea hasta que el estado cambie a completado y luego recupera la URL de la imagen generada de la respuesta.

task_id: tsk_abc123

PARÁMETROS

Parámetros de la API de GPT Image

Parámetro	Tipo	Descripción
`model`	`string`	Obligatorio. gpt-image-2-text-to-image, gpt-image-1.5-text-to-image, gpt-image-2-image-to-image o gpt-image-1.5-image-to-image.
`prompt`	`string`	Descripción de texto de la imagen a generar.
`size`	`string`	Opcional. Dimensiones de salida: 1024x1024, 1536x1024 o 1024x1536.
`quality`	`string`	Opcional. Nivel de calidad de la imagen — low, medium, high o auto. Afecta al coste por imagen.
`source_image_url`	`string`	Obligatorio para image_to_image. URL de la imagen de entrada para editar o transformar.
`callback_url`	`string`	Opcional. URL de webhook para notificación de finalización asíncrona.

¿Qué es GPT Image en Hermes Agent?

GPT Image 2 trata los prompts como briefs de producción en lugar de listas de palabras clave sueltas. Incluye un paso de razonamiento antes de generar, lo que le ayuda a seguir instrucciones estructuradas para diseño, colocación de texto y composición. Los usuarios encuentran que funciona mejor con prompts más simples y claramente estructurados -- los refinamientos complejos de múltiples pasadas pueden introducir patrones de ruido. Hermes Agent lo llama a través del proveedor personalizado de RunAPI.

Casos de uso de GPT Image

Fotografía de productos con fondos transparentes

Generar fotos de productos sobre fondos transparentes para composición en materiales de marketing, catálogos o listados e-commerce sin enmascaramiento manual.

Gráficos para campañas en redes sociales

Crear visuales para redes sociales con texto incrustado, colores de marca y estilo consistente en múltiples imágenes de campaña -- especificar el texto exacto en el prompt.

Imágenes fijas cinematográficas para conversión a video

Generar primeros fotogramas listos para video e imágenes fijas cinematográficas que pueden servir como fotogramas clave para flujos de trabajo de generación de video o ilustraciones editoriales independientes.

FAQ

Preguntas sobre GPT Image + Hermes Agent

Configuración general de Hermes Agent

¿Aún no lo has configurado? Empieza con la guía de configuración de RunAPI para Hermes Agent.

Guía de configuración de Hermes Agent →

Catálogo de modelos GPT Image

Ver todas las variantes de GPT Image, precios y documentación de la API.

GPT Image en RunAPI →

Prueba GPT Image en Hermes Agent hoy.

Obtén una clave RunAPI gratuita, configura el proveedor custom:runapi y empieza a generar imágenes con GPT Image 2 desde Hermes Agent.

Explorar modelos →