Usa Imagen 4 en Hermes Agent.
Imagen 4 es el modelo de generación de imágenes de Google DeepMind con renderizado de texto preciso y alta fidelidad al prompt. Hermes Agent lo llama a través del mismo endpoint de proveedor personalizado de RunAPI que usas para chat — sin necesidad de configurar ComfyUI ni GPU.
Usa RunAPI para generar una imagen con Google Imagen 4 desde Hermes Agent.
Requisitos:
- Lee la clave API de RUNAPI_API_KEY. No incluyas la clave en el código.
- Usa el proveedor custom:runapi ya configurado en Hermes Agent.
- Envía una solicitud POST a https://runapi.ai/v1/text_to_image.
- Establece el model en imagen-4.
- Escribe un prompt descriptivo para la imagen que deseas.
- La respuesta devuelve un task_id. Consulta el endpoint de estado de la tarea hasta que se complete.
- Cuando la tarea esté completa, recupera la URL de la imagen de la respuesta.
curl -X POST https://runapi.ai/v1/text_to_image \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "imagen-4",
"prompt": "A ceramic coffee mug on a wooden table with morning light, the text HELLO printed on the side in serif font, photorealistic"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "imagen-4"
}
Usa Imagen 4 en Hermes Agent en tres pasos
Configura RunAPI
Establece la variable de entorno RUNAPI_API_KEY. Si ya configuraste RunAPI como proveedor custom:runapi en Hermes Agent para chat, la misma clave y base_url funcionan para generación de imágenes.
export RUNAPI_API_KEY=runapi_xxx
Llama a Imagen 4
Envía una solicitud POST al endpoint text_to_image con model establecido en imagen-4. Incluye un prompt descriptivo. Añade aspect_ratio o negative_prompt según sea necesario.
POST /v1/text_to_image
Obtén el resultado
La respuesta incluye un task_id. Consulta el endpoint de estado de la tarea hasta que el estado cambie a completado. La respuesta final contiene la URL de la imagen generada.
task_id: tsk_abc123
Parámetros de la API de Imagen 4
| Parámetro | Tipo | Descripción |
|---|---|---|
model |
string |
Obligatorio. imagen-4, imagen-4-fast o imagen-4-ultra. |
prompt |
string |
Descripción de texto de la imagen deseada. |
aspect_ratio |
string |
Opcional. Ej. 1:1, 16:9, 9:16. |
negative_prompt |
string |
Opcional. Lo que se debe evitar en la imagen generada. |
¿Qué es Imagen 4 en Hermes Agent?
Imagen 4 de Google DeepMind se clasifica cerca de la cima en comparaciones directas con texto más limpio y seguimiento de prompts más estricto que la mayoría de competidores. Su sistema de tres niveles (Fast, Standard, Ultra) te permite elegir el equilibrio costo-calidad por imagen en lugar de comprometerte con un nivel de calidad para todo. Hermes Agent lo llama a través del proveedor personalizado de RunAPI -- no se requiere proyecto de Vertex AI ni cuenta GCP.
Casos de uso de Imagen 4
Generación de imágenes accesible para el equipo
Los miembros no técnicos del equipo pueden ajustar prompts y generar imágenes utilizables con el estricto seguimiento de prompts de Imagen 4 -- hace lo que pides sin necesitar experiencia en ingeniería de prompts.
Fotografía editorial y aventurera
Generar fotografía de calidad editorial -- paisajes, comida, arquitectura, lifestyle -- con iluminación precisa, profundidad de campo y gradación de color natural.
Generación por lotes optimizada para costos
Mezclar niveles dentro de un solo flujo de trabajo -- Fast para rondas de borrador a 0,02 $ por imagen, Ultra para selecciones finales -- manteniendo los costos de lotes bajos sin sacrificar la calidad final de salida.
Preguntas sobre Imagen 4 + Hermes Agent
Sí. Hermes Agent llama a Imagen 4 a través del endpoint text_to_image de RunAPI. Establece el campo model en imagen-4 y envía la solicitud con la misma RUNAPI_API_KEY que configuraste para el proveedor custom:runapi. No se necesita ComfyUI ni alquiler de GPU.
No. La misma RUNAPI_API_KEY funciona para los más de 113 modelos de chat, imagen, video y música. Una clave, una cuenta de facturación.
Imagen 4 es asíncrono. La solicitud inicial devuelve un task_id con estado pendiente. Consulta el endpoint de estado de la tarea hasta que se complete y luego recupera la URL de la imagen de la respuesta. Los SDKs de RunAPI gestionan el polling automáticamente.
Los precios de Imagen 4 son de pago por uso sin mínimo mensual. El coste varía según el nivel: imagen-4-fast es el más económico, imagen-4 es estándar e imagen-4-ultra es la mayor calidad. Consulta la página de precios de RunAPI para las tarifas actuales por imagen.
Configuración general de Hermes Agent
¿Aún no lo has configurado? Empieza con la guía de configuración de RunAPI para Hermes Agent.
Guía de configuración de Hermes Agent →Catálogo de modelos Imagen 4
Ver todas las variantes, precios y documentación de la API de Imagen 4.
Modelos de Imagen 4 →Prueba Imagen 4 en Hermes Agent hoy.
Obtén una clave RunAPI gratuita, configura el proveedor custom:runapi y empieza a generar imágenes con Google Imagen 4.