Użyj Wan w Hermes Agent.
Wan to model open-source do generowania wideo i obrazów firmy Alibaba, licencjonowany na Apache 2.0 i sklasyfikowany na #1 w rankingu text-to-video Artificial Analysis. Obejmuje ponad 20 wariantów od Wan 2.2 do 2.7 — text-to-video, image-to-video, speech-to-video z synchronizacją ust, edycja wideo przez R2V i generowanie obrazów do 4K. Hermes Agent wywołuje dowolny punkt końcowy Wan przez tego samego dostawcę custom RunAPI i klucz API używany do chatu.
Use RunAPI to generate a video with Alibaba Wan 2.7.
Requirements:
- Read the API key from RUNAPI_API_KEY.
- Use the custom:runapi provider with base_url https://runapi.ai/v1.
- Call POST https://runapi.ai/api/v1/task/text_to_video
- Set model to "wan-2.7-text-to-video".
- Set output_resolution to "1080p" for full HD output.
- Include a detailed prompt describing the scene, camera motion, and lighting.
- The response is async. Poll the returned task_id until status is "completed".
- When done, read the video URL from the response output.
curl -X POST https://runapi.ai/api/v1/task/text_to_video \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "wan-2.7-text-to-video",
"prompt": "A drone shot rising over terraced rice paddies at golden hour, mist rolling through the valleys, slow upward camera tilt",
"output_resolution": "1080p"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "wan-2.7-text-to-video"
}
Użyj Wan w Hermes Agent w trzech krokach
Skonfiguruj RunAPI
Ustaw RUNAPI_API_KEY w środowisku, w którym działa Hermes Agent. Jeśli już dodałeś RunAPI jako dostawcę custom:runapi, ten sam klucz i base_url obsługują wszystkie punkty końcowe Wan — nie jest wymagana dodatkowa konfiguracja.
export RUNAPI_API_KEY=runapi_xxx
Wywołaj punkt końcowy Wan
Wyślij żądanie POST do text_to_video z modelem ustawionym na wan-2.7-text-to-video i output_resolution na 720p lub 1080p. Do image-to-video użyj wan-2.7-image-to-video z first_frame_image_url. Do wideo sterowanego mową użyj wan-2.2-a14b-speech-to-video-turbo z source_audio_url i source_image_url. Hermes Agent kieruje wszystkie żądania przez dostawcę custom:runapi.
POST /api/v1/task/text_to_video
Odpytuj o wynik
Punkt końcowy zwraca task_id natychmiast. Odpytuj punkt końcowy statusu zadania, aż status będzie completed, a następnie odczytaj URL wideo lub obrazu wyjściowego z odpowiedzi. SDK RunAPI i CLI obsługują odpytywanie automatycznie.
GET /api/v1/task/text_to_video/tsk_abc123
Parametry API Wan text_to_video
| Parametr | Typ | Opis |
|---|---|---|
model |
string |
Wymagane. wan-2.7-text-to-video, wan-2.6-text-to-video, wan-2.5-text-to-video, wan-2.2-a14b-text-to-video-turbo lub wan-2.7-r2v. |
prompt |
string |
Wymagane. Tekstowy opis pożądanej sceny wideo, w tym ruchu kamery, oświetlenia i szczegółów podmiotu. |
output_resolution |
string |
Opcjonalne. 720p lub 1080p dla Wan 2.5+. Wan 2.2 akceptuje również 480p i 580p. Domyślnie 720p. |
aspect_ratio |
string |
Opcjonalne. Tylko dla wan-2.7-r2v. Akceptowane wartości: 16:9, 9:16, 1:1, 4:3, 3:4. |
duration_seconds |
integer |
Opcjonalne. Tylko dla wan-2.7-r2v. Długość wideo w sekundach, od 2 do 10. |
seed |
integer |
Opcjonalne. Ziarno powtarzalności dla deterministycznych wyników. |
callback_url |
string |
Opcjonalne. Adres URL webhooka, który otrzymuje POST po zakończeniu zadania. |
Czym jest Wan w Hermes Agent?
Wan firmy Alibaba to model wideo open-source Apache 2.0, który prowadzi tabele Artificial Analysis. Hermes Agent wywołuje go przez RunAPI custom provider dla tekst-do-wideo, obraz-do-wideo i mowa-do-wideo przez jedno zunifikowane API.
Zastosowania Wan
Treści marki w dużej skali
Używaj spójności postaci Wan i niewygasających kredytów do produkcji dużych wolumenów filmów marki.
Treści dialogowe z synchronizacją ust
Łącz ElevenLabs TTS z endpointem mowa-do-wideo Wan w Hermes Agent dla kompletnych mówionych filmów.
Preprodukcja wizualna dla filmowców i agencji
Generuj klipy pre-vis na poziomie produkcyjnym z zakotwiczeniem punktów końcowych dla sekwencji zgodnych ze storyboardem.
Pytania o Wan + Hermes Agent
Wszystkie. text_to_video, image_to_video, speech_to_video, text_to_image (Wan 2.7 Image), edit_video i animate. Skonfiguruj RunAPI jako dostawcę custom:runapi raz, a następnie przełączaj punkty końcowe i slug modeli per żądanie — na przykład wan-2.7-text-to-video do wideo i wan-2.7-image do generowania obrazów do 4K.
Dodaj wpis dostawcy custom:runapi z base_url ustawionym na https://runapi.ai/v1 i swoim RUNAPI_API_KEY jako kluczem API. Po skonfigurowaniu każdy punkt końcowy Wan — i wszystkie ponad 113 modeli RunAPI — jest dostępny przez tego samego dostawcę bez dodatkowych wtyczek.
Wan 2.5 wprowadził rozdzielczość 1080p. Wan 2.6 dodał edycję wideo (R2V) i warianty flash do szybszej generacji. Wan 2.7 dodaje generowanie obrazów (wan-2.7-image, wan-2.7-image-pro do 4K), edycję wideo (wan-2.7-edit-video) i ulepszoną jakość text-to-video, która prowadzi w rankingu Artificial Analysis.
Użyj wan-2.2-a14b-speech-to-video-turbo z source_audio_url (plik audio) i source_image_url (twarz do animacji). Wan generuje wideo z zsynchronizowanymi ruchami ust, gdzie twarz mówi w rytm audio. Rozdzielczość wyjściowa obsługuje 480p, 580p lub 720p.
Tak. Wan jest wydany na licencji Apache 2.0 przez Alibaba, a wagi modelu są publicznie dostępne. Przez RunAPI pomijasz konfigurację GPU — jedno wywołanie API generuje wideo lub obrazy. Jeśli potrzebujesz lokalnego potoku dla prywatności, te same wagi działają na własnej infrastrukturze.
Ogólna konfiguracja Hermes Agent
Nie skonfigurowano jeszcze? Zacznij od przewodnika konfiguracji RunAPI dla Hermes Agent.
Przewodnik konfiguracji Hermes Agent →Katalog modeli Wan
Zobacz wszystkie ponad 20 wariantów Wan, ceny i dokumentację punktów końcowych.
Wan na RunAPI →Wypróbuj Wan w Hermes Agent już dziś.
Zdobądź darmowy klucz RunAPI, skonfiguruj dostawcę custom:runapi i generuj wideo z modelem open-source sklasyfikowanym na #1 — text-to-video, image-to-video lub speech-to-video.