Użyj Wan w OpenClaw.
Wan to model open-source do generowania wideo i obrazów firmy Alibaba, licencjonowany na Apache 2.0 i sklasyfikowany na #1 w rankingu text-to-video Artificial Analysis. Obejmuje ponad 20 wariantów od Wan 2.2 do 2.7 — text-to-video, image-to-video, speech-to-video z synchronizacją ust, edycja wideo przez R2V i generowanie obrazów do 4K. Agenci OpenClaw wywołują dowolny punkt końcowy Wan tym samym kluczem RunAPI używanym do chatu.
Use RunAPI to generate a video with Alibaba Wan 2.7.
Requirements:
- Call the RunAPI text_to_video endpoint at https://runapi.ai/api/v1/task/text_to_video.
- Set model to "wan-2.7-text-to-video".
- Read the API key from the RUNAPI_API_KEY environment variable.
- Set output_resolution to "1080p" for full HD output.
- Include a detailed prompt describing the scene, camera motion, and lighting.
- The response is async. Poll the returned task_id until status is "completed".
- When done, read the video URL from the response output.
curl -X POST https://runapi.ai/api/v1/task/text_to_video \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "wan-2.7-text-to-video",
"prompt": "A drone shot rising over terraced rice paddies at golden hour, mist rolling through the valleys, slow upward camera tilt",
"output_resolution": "1080p"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "wan-2.7-text-to-video"
}
Użyj Wan w OpenClaw w trzech krokach
Skonfiguruj RunAPI
Ustaw RUNAPI_API_KEY w swoim środowisku. Jeśli już skonfigurowałeś RunAPI w OpenClaw do chatu lub generowania obrazów, ten sam klucz działa dla wszystkich punktów końcowych Wan — nie jest wymagana dodatkowa konfiguracja dostawcy.
export RUNAPI_API_KEY=runapi_xxx
Wywołaj punkt końcowy Wan
Wyślij żądanie POST do text_to_video z modelem ustawionym na wan-2.7-text-to-video i output_resolution na 720p lub 1080p. Do image-to-video użyj wan-2.7-image-to-video z first_frame_image_url. Do wideo sterowanego mową użyj wan-2.2-a14b-speech-to-video-turbo z source_audio_url i source_image_url.
POST /api/v1/task/text_to_video
Odpytuj o wynik
Punkt końcowy zwraca task_id natychmiast. Odpytuj punkt końcowy statusu zadania, aż status będzie completed, a następnie odczytaj URL wideo lub obrazu wyjściowego z odpowiedzi. SDK RunAPI i CLI obsługują odpytywanie automatycznie.
GET /api/v1/task/text_to_video/tsk_abc123
Parametry API Wan text_to_video
| Parametr | Typ | Opis |
|---|---|---|
model |
string |
Wymagane. wan-2.7-text-to-video, wan-2.6-text-to-video, wan-2.5-text-to-video, wan-2.2-a14b-text-to-video-turbo lub wan-2.7-r2v. |
prompt |
string |
Wymagane. Tekstowy opis pożądanej sceny wideo, w tym ruchu kamery, oświetlenia i szczegółów podmiotu. |
output_resolution |
string |
Opcjonalne. 720p lub 1080p dla Wan 2.5+. Wan 2.2 akceptuje również 480p i 580p. Domyślnie 720p. |
aspect_ratio |
string |
Opcjonalne. Tylko dla wan-2.7-r2v. Akceptowane wartości: 16:9, 9:16, 1:1, 4:3, 3:4. |
duration_seconds |
integer |
Opcjonalne. Tylko dla wan-2.7-r2v. Długość wideo w sekundach, od 2 do 10. |
seed |
integer |
Opcjonalne. Ziarno powtarzalności dla deterministycznych wyników. |
callback_url |
string |
Opcjonalne. Adres URL webhooka, który otrzymuje POST po zakończeniu zadania. |
Czym jest Wan w OpenClaw?
Wan firmy Alibaba to model wideo open-source (Apache 2.0) plasujący się na szczycie tablic Artificial Analysis tekst-do-wideo. Oferuje kontrolę pierwszej i ostatniej klatki dla generowania zakotwiczonego w punktach końcowych, wideo wieloujęciowe ze spójnością postaci i natywne audio z synchronizacją ust. Agenty OpenClaw mają dostęp do wszystkich 20+ wariantów Wan przez RunAPI jednym kluczem API.
Zastosowania Wan
Workflow storyboard-do-wideo
Używaj zakotwiczenia pierwszej i ostatniej klatki do przekształcania ilustracji storyboardu w płynne sekwencje wideo.
Wirtualni prezenterzy i maskotki marki
Generuj wideo z mówiącą głową ze zdjęcia twarzy i pliku audio dla prezentacji marki.
Sekwencje wieloujęciowe ze spójnością postaci
Buduj treści dialogowe lub narracyjne, gdzie ta sama postać pozostaje spójna w wielu scenach.
Pytania o Wan + OpenClaw
Wszystkie. text_to_video, image_to_video, speech_to_video, text_to_image (Wan 2.7 Image), edit_video i animate. Każdy punkt końcowy używa innego slug modelu — na przykład wan-2.7-text-to-video do generowania wideo i wan-2.7-image do generowania obrazów do 4K.
Wan 2.5 wprowadził rozdzielczość 1080p. Wan 2.6 dodał edycję wideo (R2V) i warianty flash do szybszej generacji. Wan 2.7 dodaje generowanie obrazów (wan-2.7-image, wan-2.7-image-pro do 4K), edycję wideo (wan-2.7-edit-video) i ulepszoną jakość text-to-video, która prowadzi w rankingu Artificial Analysis.
Użyj wan-2.2-a14b-speech-to-video-turbo z source_audio_url (plik audio) i source_image_url (twarz do animacji). Wan generuje wideo z zsynchronizowanymi ruchami ust, gdzie twarz mówi w rytm audio. Rozdzielczość wyjściowa obsługuje 480p, 580p lub 720p.
Tak. Wan 2.7 dodał punkty końcowe text_to_image. Użyj wan-2.7-image do standardowej generacji lub wan-2.7-image-pro dla wyższej jakości. Oba obsługują proporcje od 1:1 do 21:9 i rozdzielczości wyjściowe 1k, 2k lub 4k.
Tak. Wan jest wydany na licencji Apache 2.0 przez Alibaba, a wagi modelu są publicznie dostępne. Przez RunAPI pomijasz konfigurację GPU — jedno wywołanie API generuje wideo lub obrazy. Jeśli potrzebujesz lokalnego potoku dla prywatności, te same wagi działają na własnej infrastrukturze.
Ogólna konfiguracja OpenClaw
Nie skonfigurowano jeszcze? Zacznij od przewodnika konfiguracji RunAPI dla OpenClaw.
Przewodnik konfiguracji OpenClaw →Katalog modeli Wan
Zobacz wszystkie ponad 20 wariantów Wan, ceny i dokumentację punktów końcowych.
Wan na RunAPI →Wypróbuj Wan w OpenClaw już dziś.
Zdobądź darmowy klucz RunAPI, wklej prompt do OpenClaw i generuj wideo z modelem open-source sklasyfikowanym na #1 — text-to-video, image-to-video lub speech-to-video.