---
title: &quot;Usa Wan en OpenClaw con RunAPI — Guía de API de video e imágenes&quot;
url: &quot;https://runapi.ai/es/openclaw-wan.md&quot;
canonical: &quot;https://runapi.ai/es/openclaw-wan&quot;
locale: &quot;es&quot;
model: &quot;wan&quot;
---

# Usa Wan en OpenClaw.

Wan es el modelo de generación de video e imágenes de código abierto de Alibaba, con licencia Apache 2.0 y clasificado n.º 1 en el ranking de texto a video de Artificial Analysis. Abarca más de 20 variantes desde Wan 2.2 hasta 2.7 — texto a video, imagen a video, voz a video con sincronización labial, edición de video vía R2V y generación de imágenes hasta 4K. Los agentes de OpenClaw llaman a cualquier endpoint de Wan a través de la misma clave de RunAPI usada para chat.

## API example

```bash
curl -X POST https://runapi.ai/api/v1/task/text_to_video \
  -H &quot;Authorization: Bearer $RUNAPI_API_KEY&quot; \
  -H &quot;Content-Type: application/json&quot; \
  -d &#39;{
    &quot;model&quot;: &quot;wan-2.7-text-to-video&quot;,
    &quot;prompt&quot;: &quot;A drone shot rising over terraced rice paddies at golden hour, mist rolling through the valleys, slow upward camera tilt&quot;,
    &quot;output_resolution&quot;: &quot;1080p&quot;
  }&#39;

```

### Response

```json
{
  &quot;task_id&quot;: &quot;tsk_abc123&quot;,
  &quot;status&quot;: &quot;pending&quot;,
  &quot;model&quot;: &quot;wan-2.7-text-to-video&quot;
}

```

## How it works

1. **Configura RunAPI** — Establece RUNAPI_API_KEY en tu entorno. Si ya configuraste RunAPI en OpenClaw para chat o generación de imágenes, la misma clave funciona para todos los endpoints de Wan — no se necesita configuración de proveedor adicional.
2. **Llama a un endpoint de Wan** — Envía un POST a text_to_video con model establecido en wan-2.7-text-to-video y output_resolution en 720p o 1080p. Para imagen a video, usa wan-2.7-image-to-video con first_frame_image_url. Para video a partir de voz, usa wan-2.2-a14b-speech-to-video-turbo con source_audio_url y source_image_url.
3. **Consulta el resultado** — El endpoint devuelve un task_id inmediatamente. Consulta el endpoint de estado de la tarea hasta que el estado sea completado, luego lee la URL del video o imagen de salida de la respuesta. Los SDKs de RunAPI y la CLI gestionan el polling automáticamente.

## Parameters

| Parameter | Type | Description |
|-----------|------|-------------|
| `model` | `string` | Obligatorio. wan-2.7-text-to-video, wan-2.6-text-to-video, wan-2.5-text-to-video, wan-2.2-a14b-text-to-video-turbo o wan-2.7-r2v. |
| `prompt` | `string` | Obligatorio. Descripción de texto de la escena de video deseada, incluyendo movimiento de cámara, iluminación y detalle del sujeto. |
| `output_resolution` | `string` | Opcional. 720p o 1080p para Wan 2.5+. Wan 2.2 también acepta 480p y 580p. Por defecto 720p. |
| `aspect_ratio` | `string` | Opcional. Solo para wan-2.7-r2v. Valores aceptados: 16:9, 9:16, 1:1, 4:3, 3:4. |
| `duration_seconds` | `integer` | Opcional. Solo para wan-2.7-r2v. Duración del video en segundos, de 2 a 10. |
| `seed` | `integer` | Opcional. Semilla de reproducibilidad para salida determinista. |
| `callback_url` | `string` | Opcional. URL de webhook que recibe un POST cuando la tarea se completa. |

## FAQ

### ¿Qué endpoints de Wan puedo llamar desde OpenClaw?

Todos. text_to_video, image_to_video, speech_to_video, text_to_image (Wan 2.7 Image), edit_video y animate. Cada endpoint usa un slug de modelo diferente — por ejemplo wan-2.7-text-to-video para generación de video y wan-2.7-image para generación de imágenes hasta 4K.

### ¿Cuál es la diferencia entre Wan 2.5, 2.6 y 2.7?

Wan 2.5 introdujo salida a 1080p. Wan 2.6 añadió edición de video (R2V) y variantes flash para generación más rápida. Wan 2.7 añade generación de imágenes (wan-2.7-image, wan-2.7-image-pro hasta 4K), edición de video (wan-2.7-edit-video) y mejor calidad de texto a video que lidera el ranking de Artificial Analysis.

### ¿Cómo funciona speech-to-video con Wan?

Usa wan-2.2-a14b-speech-to-video-turbo con source_audio_url (el archivo de audio) y source_image_url (el rostro a animar). Wan genera un video con sincronización labial donde el rostro habla el audio. La resolución de salida admite 480p, 580p o 720p.

### ¿Puedo generar imágenes con Wan?

Sí. Wan 2.7 añadió endpoints text_to_image. Usa wan-2.7-image para generación estándar o wan-2.7-image-pro para mayor calidad. Ambos admiten relaciones de aspecto de 1:1 a 21:9 y resoluciones de salida de 1k, 2k o 4k.

### ¿Wan es de código abierto? ¿Puedo auto-alojarlo?

Sí. Wan se publica bajo licencia Apache 2.0 por Alibaba y los pesos del modelo están disponibles públicamente. A través de RunAPI te saltas la configuración de GPU — una sola llamada a la API genera video o imágenes. Si necesitas un pipeline auto-alojado por privacidad, los mismos pesos funcionan en tu propia infraestructura.


## Links

- [Guía de configuración de OpenClaw →](https://runapi.ai/es/openclaw)
- [Wan en RunAPI →](https://runapi.ai/es/models/wan)
- [Model catalog](https://runapi.ai/es/models)
- [API docs](https://runapi.ai/es/docs)