Quels endpoints Wan puis-je appeler depuis OpenClaw ?

Tous. text_to_video, image_to_video, speech_to_video, text_to_image (Wan 2.7 Image), edit_video et animate. Chaque endpoint utilise un slug de modèle différent — par exemple wan-2.7-text-to-video pour la génération vidéo et wan-2.7-image pour la génération d'images jusqu'à 4K.

Quelle est la différence entre Wan 2.5, 2.6 et 2.7 ?

Wan 2.5 a introduit la sortie 1080p. Wan 2.6 a ajouté l'édition vidéo (R2V) et des variantes flash pour une génération plus rapide. Wan 2.7 ajoute la génération d'images (wan-2.7-image, wan-2.7-image-pro jusqu'à 4K), l'édition vidéo (wan-2.7-edit-video) et une qualité text-to-video améliorée qui mène le classement Artificial Analysis.

Comment fonctionne speech-to-video avec Wan ?

Utilisez wan-2.2-a14b-speech-to-video-turbo avec source_audio_url (le fichier audio) et source_image_url (le visage à animer). Wan génère une vidéo synchronisée avec les lèvres où le visage parle l'audio. La résolution de sortie supporte 480p, 580p ou 720p.

Puis-je générer des images avec Wan ?

Oui. Wan 2.7 a ajouté des endpoints text_to_image. Utilisez wan-2.7-image pour une génération standard ou wan-2.7-image-pro pour une qualité supérieure. Les deux supportent des ratios d'aspect de 1:1 à 21:9 et des résolutions de sortie 1k, 2k ou 4k.

Wan est-il open source ? Puis-je l'auto-héberger ?

Oui. Wan est publié sous Apache 2.0 par Alibaba et les poids du modèle sont publiquement disponibles. Via RunAPI, vous évitez la configuration GPU — un seul appel API génère des vidéos ou des images. Si vous avez besoin d'un pipeline auto-hébergé pour la confidentialité, les mêmes poids fonctionnent sur votre propre infrastructure.

OPENCLAW + WAN

Utiliser Wan dans OpenClaw.

Wan est le modèle de génération vidéo et d'images open source d'Alibaba, sous licence Apache 2.0 et classé #1 sur le classement text-to-video d'Artificial Analysis. Il couvre 20+ variantes de Wan 2.2 à 2.7 — text-to-video, image-to-video, speech-to-video avec lip-sync, édition vidéo via R2V et génération d'images jusqu'à 4K. Les agents OpenClaw appellent n'importe quel endpoint Wan via la même clé RunAPI utilisée pour le chat.

Obtenir une API Key Lire la documentation

une seule clé API · 20+ variantes Wan · open source Apache 2.0

Utilisez RunAPI pour générer une vidéo avec Alibaba Wan 2.7.


  Exigences :

  - Appeler l'endpoint text_to_video de RunAPI à https://runapi.ai/api/v1/task/text_to_video.

  - Définir le modèle sur "wan-2.7-text-to-video".

  - Lire la clé API depuis la variable d'environnement RUNAPI_API_KEY.

  - Définir output_resolution sur "1080p" pour une sortie Full HD.

  - Inclure un prompt détaillé décrivant la scène, le mouvement de caméra et l'éclairage.

  - La réponse est asynchrone. Interroger le task_id retourné jusqu'à ce que le statut soit "completed".

  - Une fois terminé, lire l'URL de la vidéo depuis la réponse.

curl -X POST https://runapi.ai/api/v1/task/text_to_video \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "wan-2.7-text-to-video",
    "prompt": "A drone shot rising over terraced rice paddies at golden hour, mist rolling through the valleys, slow upward camera tilt",
    "output_resolution": "1080p"
  }'

{
  "task_id": "tsk_abc123",
  "status": "pending",
  "model": "wan-2.7-text-to-video"
}

Copiez la commande curl pour tester wan

FONCTIONNEMENT

Utiliser Wan dans OpenClaw en trois étapes

Configurer RunAPI

Définissez RUNAPI_API_KEY dans votre environnement. Si vous avez déjà configuré RunAPI dans OpenClaw pour le chat ou la génération d'images, la même clé fonctionne pour tous les endpoints Wan — aucune configuration de fournisseur supplémentaire requise.

export RUNAPI_API_KEY=runapi_xxx

Appeler un endpoint Wan

Envoyez une requête POST à text_to_video avec le modèle défini sur wan-2.7-text-to-video et output_resolution à 720p ou 1080p. Pour image-to-video, utilisez wan-2.7-image-to-video avec first_frame_image_url. Pour la vidéo pilotée par la voix, utilisez wan-2.2-a14b-speech-to-video-turbo avec source_audio_url et source_image_url.

POST /api/v1/task/text_to_video

Obtenir le résultat

L'endpoint retourne immédiatement un task_id. Interrogez l'endpoint de statut de tâche jusqu'à ce que le statut soit completed, puis lisez l'URL de la vidéo ou de l'image de sortie depuis la réponse. Les SDK et la CLI RunAPI gèrent le polling automatiquement.

GET /api/v1/task/text_to_video/tsk_abc123

PARAMÈTRES

Paramètres API text_to_video de Wan

Paramètre	Type	Description
`model`	`string`	Requis. wan-2.7-text-to-video, wan-2.6-text-to-video, wan-2.5-text-to-video, wan-2.2-a14b-text-to-video-turbo ou wan-2.7-r2v.
`prompt`	`string`	Requis. Description textuelle de la scène vidéo souhaitée, incluant le mouvement de caméra, l'éclairage et le détail du sujet.
`output_resolution`	`string`	Optionnel. 720p ou 1080p pour Wan 2.5+. Wan 2.2 accepte aussi 480p et 580p. Par défaut 720p.
`aspect_ratio`	`string`	Optionnel. Pour wan-2.7-r2v uniquement. Valeurs acceptées : 16:9, 9:16, 1:1, 4:3, 3:4.
`duration_seconds`	`integer`	Optionnel. Pour wan-2.7-r2v uniquement. Durée de la vidéo en secondes, de 2 à 10.
`seed`	`integer`	Optionnel. Graine de reproductibilité pour une sortie déterministe.
`callback_url`	`string`	Optionnel. URL webhook qui reçoit un POST lorsque la tâche se termine.

Qu'est-ce que Wan sur OpenClaw ?

Wan d'Alibaba est un modèle vidéo open source (Apache 2.0) classé en tête du classement Artificial Analysis text-to-video. Il offre un contrôle du premier et du dernier plan pour une génération ancrée aux extrémités, une vidéo multi-plans avec cohérence des personnages et un audio natif incluant la conversion parole-vers-vidéo synchronisée sur les lèvres. Les agents OpenClaw accèdent à toutes les 20+ variantes de Wan via RunAPI avec une seule clé API.

Cas d'utilisation de Wan

Workflow storyboard vers vidéo

Utiliser l'ancrage du premier et du dernier plan pour transformer les panneaux de storyboard en séquences vidéo. Chaque clip commence et se termine sur vos images clés, maintenant la continuité visuelle sur un projet multi-plans.

Présentateurs virtuels et mascottes de marque

Générer une vidéo talking head à partir d'une image de visage et d'un fichier audio via l'endpoint parole-vers-vidéo de Wan. Le modèle gère la synchronisation labiale et le mouvement de tête pour du contenu cohérent de porte-parole de marque.

Séquences multi-plans avec cohérence des personnages

Construire du contenu riche en dialogue ou narratif où le même personnage apparaît dans plusieurs clips. La cohérence temporelle de Wan maintient les visages et les tenues stables entre les plans.

FAQ

Questions sur Wan + OpenClaw

Configuration générale de OpenClaw

Pas encore configuré ? Commencez par le guide de configuration RunAPI pour OpenClaw.

Guide de configuration OpenClaw →

Catalogue des modèles Wan

Voir les 20+ variantes de Wan, les niveaux de tarification et la documentation des endpoints.

Wan sur RunAPI →

Essayez Wan dans OpenClaw dès aujourd'hui.

Obtenez une clé RunAPI gratuite, collez le prompt dans OpenClaw et générez des vidéos avec le modèle open source classé #1 — text-to-video, image-to-video ou speech-to-video.

Parcourir les modèles →