Usa Wan en Hermes Agent.
Wan de Alibaba es un modelo de video e imagen de código abierto con texto a video, imagen a video, voz a video y edición de video. Hermes Agent lo llama a través del proveedor custom:runapi — la misma clave y URL base configuradas para chat. Múltiples versiones disponibles desde 2.2 a 2.7 con variantes Flash para mayor velocidad. Las tareas son asíncronas.
Usa RunAPI para generar un video con Wan a través de Hermes Agent.
Requisitos:
- Usa el proveedor custom:runapi ya configurado en Hermes Agent
- Llama al endpoint text_to_video de RunAPI en https://runapi.ai/v1/text_to_video
- Establece model en "wan-2.7-text-to-video"
- La variable de entorno RUNAPI_API_KEY proporciona la autorización
- Opcionalmente establece resolution (480p, 720p, 1080p) y duration
- La respuesta es asíncrona — consulta el task_id devuelto hasta que el estado sea completado
curl -X POST https://runapi.ai/v1/text_to_video \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "wan-2.7-text-to-video",
"prompt": "A neon-lit cyberpunk city street at night with holographic advertisements and rain reflections",
"resolution": "720p",
"duration": 5
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "wan-2.7-text-to-video"
}
Usa Wan en Hermes Agent en tres pasos
Configura RunAPI
Establece la variable de entorno RUNAPI_API_KEY. Si ya añadiste RunAPI como proveedor custom:runapi en Hermes Agent para chat, la misma clave y base_url gestionan también las solicitudes de video de Wan.
export RUNAPI_API_KEY=runapi_xxx
Llama a Wan
Envía un POST al endpoint text_to_video con model wan-2.7-text-to-video. Incluye un prompt descriptivo y opcionalmente establece resolution (480p, 720p o 1080p) y duration. Para animación desde imagen, usa el endpoint image_to_video con una image_url.
POST /v1/text_to_video
Obtén el resultado
El endpoint devuelve un task_id con estado pendiente. Consulta el endpoint de estado de la tarea hasta que el estado cambie a completado y luego recupera la URL del video generado de la respuesta.
task_id: tsk_abc123
Parámetros de la API de Wan
| Parámetro | Tipo | Descripción |
|---|---|---|
model |
string |
Obligatorio. wan-2.7-text-to-video, wan-2.6-text-to-video, wan-2.5-text-to-video, wan-2.7-image-to-video u otra variante de Wan. |
prompt |
string |
Descripción de texto del video a generar. |
resolution |
string |
Opcional. Resolución de salida — 480p, 720p o 1080p. |
duration |
integer |
Opcional. Duración del video en segundos. |
image_url |
string |
Obligatorio para image_to_video. URL de la imagen de referencia a animar. |
callback_url |
string |
Opcional. URL de webhook para notificación de finalización asíncrona. |
¿Qué es Wan en Hermes Agent?
Wan de Alibaba es un modelo de video de código abierto Apache 2.0 que lidera el clasificador de Artificial Analysis para calidad de texto a video. A través del proveedor custom:runapi de Hermes Agent, abarca más de 20 variantes -- texto a video, imagen a video, voz a video con sincronización de labios y edición de video. Sus pesos abiertos significan que también puedes alojarlo tú mismo si tu flujo de trabajo requiere privacidad de datos, mientras RunAPI maneja la infraestructura GPU para uso alojado.
Casos de uso de Wan
Contenido de marca en volumen
Usar la consistencia de personajes de Wan y créditos no vencidos para producir contenido de video de marca a escala. Hermes Agent puede despachar tareas de generación paralelas en diferentes líneas de productos.
Contenido rico en diálogo con sincronización de labios
Encadenar ElevenLabs TTS con el endpoint de voz a video de Wan en un flujo de trabajo de Hermes Agent para ir de texto de guión a un video parlante sincronizado con labios sin pasos manuales.
Previsualización para cineastas y agencias
Generar clips de previsualización de calidad de producción con fotogramas clave anclados en los extremos. Establecer imágenes de primer y último fotograma para controlar las transiciones exactas de escena para revisión del cliente.
Preguntas sobre Wan + Hermes Agent
Sí. Llama al endpoint text_to_video con cualquier variante de Wan (wan-2.7-text-to-video, wan-2.6-text-to-video, etc.) a través del proveedor custom:runapi. La misma RUNAPI_API_KEY que usas para chat gestiona también las solicitudes de video de Wan.
Wan 2.7 es la variante más reciente con mejor calidad visual. Wan 2.6 ofrece opciones Flash para generación más rápida. Wan 2.5 es la versión de producción estable. Wan 2.2 incluye variantes especializadas para síntesis de voz a video. Todas comparten la misma clave API y endpoint.
Wan se factura por segundo de video generado. El coste varía según la variante del modelo y la resolución. Consulta la página de precios de RunAPI para las tarifas actuales.
Sí. Usa el endpoint image_to_video con wan-2.7-image-to-video o cualquier variante image_to_video de Wan. Pasa una image_url junto con el prompt de texto. El modelo anima la imagen de referencia.
Sí. Wan 2.2 incluye variantes especializadas para voz a video (wan-2.2-a14b-speech-to-video-turbo) que generan video sincronizado con audio de voz. También hay variantes animate para animar imágenes con movimiento controlado.
Configuración general de Hermes Agent
¿Aún no lo has configurado? Empieza con la guía de configuración de RunAPI para Hermes Agent.
Guía de configuración de Hermes Agent →Catálogo de modelos Wan
Ver todas las variantes de Wan, precios y documentación de la API.
Modelos de Wan →Prueba Wan en Hermes Agent hoy.
Obtén una clave RunAPI gratuita, configura el proveedor custom:runapi y empieza a generar video con código abierto de Wan desde Hermes Agent.