OPENCLAW IMAGE GENERATION

Añade Flux, Imagen 4 y GPT Image a OpenClaw — Sin Habilidades Extra

La misma clave de API que tu agente OpenClaw usa para chat también llama a Flux Kontext, Imagen 4, Seedream y GPT Image 2 — más de 10 modelos de imagen, sin habilidades adicionales. El coste de imagen empieza en 2 céntimos por generación, pago por uso.

Actualizado el June 11, 2026 RunAPI Editorial Team
Prompt
Install the RunAPI CLI and generate an image in this OpenClaw workspace.

- Run: npx runapi
- It will prompt you for an API key. Sign up at https://runapi.ai if you don't have one.
- Then run: npx runapi run text_to_image --model flux-kontext-pro --prompt "A red cube on a white table"
- Confirm the image URL appears in the output.

Available image models: flux-kontext-pro, imagen-4, seedream-5-lite-text-to-image, gpt-image-2-text-to-image.
Copy prompt → paste in OpenClaw flux-kontext-pro
IMAGE MODELS

Cuatro modelos de imagen, una clave de API, cero habilidades extra

Cada modelo cubre una necesidad de producción diferente. Flux Kontext gestiona ediciones coherentes con la marca y renderizado de texto. Imagen 4 produce resultados fotorrealistas con alta fidelidad al prompt. Seedream 5 Lite es rápido y de bajo coste para flujos de trabajo de alto volumen. GPT Image 2 destaca en ediciones que siguen instrucciones y composición. Los cuatro son accesibles desde el mismo endpoint de RunAPI que tu agente OpenClaw ya usa para chat.

Flux Kontext Pro

Renderizado de texto, coherencia de marca y edición en contexto. Ideal para materiales de marketing donde importan los textos superpuestos y las referencias de estilo. Desde 2,5 céntimos por imagen.

Imagen 4

Generación fotorrealista con alta fidelidad al prompt. Los niveles estándar, rápido y ultra permiten equilibrar velocidad y detalle. Desde 2 céntimos por imagen.

Seedream 5 Lite

Generación rápida y de bajo coste para flujos de trabajo masivos. Maneja texto a imagen e imagen a imagen a 2,75 céntimos por llamada, ideal para prototipado e iteración.

GPT Image 2

Edición y composición guiadas por instrucciones. Óptimo para tareas donde el prompt describe una transformación — eliminación de fondo, transferencia de estilo, colocación de objetos.

HOW TO USE

Genera imágenes en OpenClaw a través de RunAPI

1

Configura RunAPI en OpenClaw

Si aún no has configurado RunAPI en OpenClaw, sigue la guía de configuración de OpenClaw. Añade el proveedor RunAPI con baseUrl https://runapi.ai/v1 y tu variable de entorno RUNAPI_API_KEY.

2

Envía una solicitud de generación de imágenes

Usa el endpoint de tarea de RunAPI desde el código de tu agente o una llamada HTTP directa. Establece el campo model con el slug del modelo de imagen, como flux-kontext-pro, imagen-4 o gpt-image-2. El cuerpo de la solicitud sigue el mismo patrón JSON que las llamadas a LLM.

3

Consulta y recupera el resultado

Las tareas de imagen devuelven un ID de tarea. Consulta el endpoint de estado de tarea o usa un callback de webhook. Cuando la tarea se completa, la respuesta incluye la URL de la imagen generada. Los SDK y la CLI de RunAPI gestionan el polling automáticamente.

MODEL COMPARISON

Flux Kontext vs Imagen 4 vs Seedream vs GPT Image 2

Punto de comparación Flux Kontext Pro Imagen 4 Seedream 5 Lite GPT Image 2
Uso predeterminado óptimo Ediciones coherentes con la marca, textos superpuestos, colocación de logotipos y modificación de imágenes en contexto con referencias de estilo. Generación fotorrealista a partir de prompts detallados, fotografía de producto y salida de imagen única de alta fidelidad. Generación masiva rápida y prototipado donde la velocidad y el coste importan más que el detalle máximo. Composición guiada por instrucciones, cambios de fondo, transferencias de estilo y edición de imágenes en múltiples pasos.
Tipos de entrada Prompt de texto, imagen de referencia para edición en contexto, referencias de estilo. Prompt de texto. Niveles de calidad rápido, estándar y ultra. Prompt de texto, imagen a imagen con una URL de imagen fuente. Prompt de texto para generación, texto más URL de imagen para edición y composición.
Calidad de salida Alto detalle con renderizado de texto preciso. Sobresale en preservar elementos de marca entre ediciones. Fotorrealista con alta fidelidad al prompt. Nivel ultra para máximo detalle. Buena calidad a gran velocidad. Adecuado para borradores, miniaturas y bucles de iteración. Alta calidad con gran capacidad de seguir instrucciones. Óptimo para ediciones que requieren entender relaciones espaciales.
Velocidad Velocidad de generación estándar. Adecuado para flujos de trabajo interactivos y por lotes. Nivel rápido disponible para salida casi instantánea. Los niveles estándar y ultra sacrifican velocidad por calidad. El más rápido de los cuatro. Optimizado para pipelines de alto volumen. Velocidad estándar. Ligeramente más lento en ediciones complejas de múltiples pasos.
Coste por imagen Desde 2,5 céntimos (Pro). Nivel máximo a 5 céntimos para mayor fidelidad. De 2 céntimos (Rápido) a 6 céntimos (Ultra). Estándar a 4 céntimos. 2,75 céntimos por imagen tanto para texto a imagen como para imagen a imagen. Desde 3 céntimos. Precios basados en resolución.
Óptimo para agentes OpenClaw Cuando el flujo de trabajo del agente incluye activos de marca, imágenes de marketing o visuales con texto. Cuando el agente necesita salida fotorrealista a partir de una descripción en lenguaje natural. Cuando el agente genera muchas imágenes por sesión y el coste o la velocidad son prioritarios. Cuando el agente edita imágenes existentes basándose en instrucciones del usuario.
USE CASES

Generación de activos de marketing

Los agentes OpenClaw pueden generar imágenes de producto, visuales para redes sociales y creatividades publicitarias llamando a Flux Kontext o Imagen 4. El agente escribe el prompt según el contexto de la conversación y recupera la imagen terminada en la misma sesión.

Explorar Flux Kontext

Edición automatizada de imágenes

Pasa una URL de imagen existente a GPT Image 2 o Seedream con una instrucción de edición. El agente puede eliminar fondos, cambiar estilos o componer elementos sin herramientas de diseño manuales.

Explorar GPT Image 2

Iteración de imágenes en alto volumen

Los agentes OpenClaw que prototipan componentes de UI, anuncios sociales o variaciones de producto se benefician de la velocidad y el bajo coste por imagen de Seedream 5 Lite. Genera 20 borradores por sesión y luego dirige el prompt seleccionado a Flux Kontext Pro para la salida final.

Explorar Seedream
API EXAMPLES

Genera imágenes a través del endpoint de tarea de RunAPI

Usa la misma clave de RunAPI y el mismo ciclo de vida de tarea para cada modelo de imagen. Cambia el slug del modelo y el endpoint para alternar entre Flux, Imagen, Seedream y GPT Image. La respuesta devuelve un ID de tarea para consultar.

{
  "model": "flux-kontext-pro",
  "prompt": "A futuristic city skyline at sunset, photorealistic, 8K detail"
}
POST /api/v1/task/text_to_image tarea asíncrona
{
  "model": "imagen-4",
  "prompt": "A golden retriever wearing astronaut suit, studio lighting"
}
POST /api/v1/task/text_to_image tarea asíncrona
{
  "model": "gpt-image-2",
  "prompt": "Remove the background and add a tropical beach",
  "image_url": "https://example.com/photo.jpg"
}
POST /api/v1/task/edit_image tarea asíncrona
BEYOND IMAGES

La misma clave de API genera video y música

Generación de video

Genera clips de video con Kling 3.0, Veo 3 y Seedance 2.0. Los endpoints de texto a video e imagen a video siguen el mismo ciclo de tarea asíncrona que la generación de imágenes.

Comparar API de video

Creación de música

Crea pistas musicales con Suno v4, v4.5 y v5. Describe el género, el estado de ánimo y la letra en el prompt. El agente recibe las URLs de audio cuando la tarea se completa.

Explorar modelos Suno
PRICING

El coste de generación de imágenes empieza en 2 céntimos por imagen

RunAPI usa precios de pago por uso sin suscripción mensual. Cada modelo de imagen tiene un coste por generación basado en el nivel del modelo y la resolución de salida. Flux Kontext Pro empieza en 2,5 céntimos, Imagen 4 Fast en 2 céntimos, Seedream 5 Lite en 2,75 céntimos y GPT Image 2 en 3 céntimos. Consulta la página de precios en tiempo real para las tarifas actuales en los más de 113 modelos.

Metodología de precios

Los precios de esta página reflejan las tarifas de pago por uso de RunAPI en el momento de la publicación. RunAPI establece los precios en función del coste de cómputo más un margen transparente. El coste real por imagen puede variar según la resolución, el nivel de calidad u opciones específicas del modelo. Confirma siempre los precios actuales en la página de precios en tiempo real antes de desplegar en producción.

FAQ

Preguntas frecuentes sobre generación de imágenes en OpenClaw

¿Cómo elijo entre Flux Kontext e Imagen 4 para mi flujo de trabajo en OpenClaw?

Usa Flux Kontext Pro cuando el agente produzca activos de marca, imágenes de marketing o visuales que incluyan texto — preserva el estilo y renderiza el texto con precisión. Usa Imagen 4 cuando el agente necesite salida fotorrealista a partir de una descripción en lenguaje natural. Ambos están disponibles desde el mismo endpoint de RunAPI.

¿Qué modelos de imagen funcionan con OpenClaw a través de RunAPI?

Flux Kontext Pro y Max, Imagen 4 en niveles rápido, estándar y ultra, Seedream 5 Lite, GPT Image 2, Nano Banana y varios más. Más de 10 modelos de imagen de 6 proveedores están disponibles con la misma clave de API. La lista completa está disponible en la página de precios de RunAPI y se actualiza automáticamente al añadir nuevos modelos.

¿Cuánto cuesta la generación de imágenes a través de RunAPI?

Los precios empiezan en 2 céntimos por imagen con Imagen 4 Fast. Flux Kontext Pro cuesta 2,5 céntimos, Seedream 5 Lite cuesta 2,75 céntimos y GPT Image 2 empieza en 3 céntimos. Todos los precios son de pago por uso sin mínimo mensual.

¿RunAPI cobra por separado las llamadas de imagen y las llamadas a LLM?

No. RunAPI usa un saldo único de créditos para todas las modalidades. Las llamadas de imagen, video, música y LLM consumen del mismo saldo de cuenta. No hay suscripción por modalidad ni gasto mínimo. Puedes monitorear el gasto por modelo en el panel de RunAPI.

¿Cómo cambio entre modelos de imagen en mi flujo de trabajo de OpenClaw?

Cambia el campo model en el cuerpo de la solicitud. El endpoint, la clave de API, el ciclo de vida de la tarea y el patrón de consulta se mantienen igual. Tu agente puede enrutar a diferentes modelos según la tarea sin cambiar ningún código de integración. Por ejemplo, enruta borradores a seedream-5-lite-text-to-image y exportaciones finales a flux-kontext-pro.

¿Es RunAPI más barato que fal.ai o Replicate para la generación de imágenes?

La generación de imágenes en RunAPI empieza en 2 céntimos por imagen frente a fal.ai con aproximadamente 4 céntimos y Replicate con aproximadamente 3,5 céntimos por imagen. Los precios varían según el modelo y la resolución. Consulta la página de precios de RunAPI para las tarifas actuales por modelo.

START GENERATING

Añade generación de imágenes a OpenClaw en minutos.

Una clave de RunAPI le da a tu agente OpenClaw acceso a Flux Kontext, Imagen 4, Seedream, GPT Image 2 y más de 100 modelos adicionales de imagen, video, música y LLM. Sin habilidades extra, sin cuentas de facturación adicionales.