Utiliser Wan dans Hermes Agent.
Wan est le modèle de génération vidéo et d'images open source d'Alibaba, sous licence Apache 2.0 et classé #1 sur le classement text-to-video d'Artificial Analysis. Il couvre 20+ variantes de Wan 2.2 à 2.7 — text-to-video, image-to-video, speech-to-video avec lip-sync, édition vidéo via R2V et génération d'images jusqu'à 4K. Hermes Agent appelle n'importe quel endpoint Wan via le même fournisseur personnalisé RunAPI et la même clé API utilisés pour le chat.
Utilisez RunAPI pour générer une vidéo avec Alibaba Wan 2.7.
Exigences :
- Lire la clé API depuis RUNAPI_API_KEY.
- Utiliser le fournisseur custom:runapi avec base_url https://runapi.ai/v1.
- Appeler POST https://runapi.ai/api/v1/task/text_to_video
- Définir le modèle sur "wan-2.7-text-to-video".
- Définir output_resolution sur "1080p" pour une sortie Full HD.
- Inclure un prompt détaillé décrivant la scène, le mouvement de caméra et l'éclairage.
- La réponse est asynchrone. Interroger le task_id retourné jusqu'à ce que le statut soit "completed".
- Une fois terminé, lire l'URL de la vidéo depuis la réponse.
curl -X POST https://runapi.ai/api/v1/task/text_to_video \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "wan-2.7-text-to-video",
"prompt": "A drone shot rising over terraced rice paddies at golden hour, mist rolling through the valleys, slow upward camera tilt",
"output_resolution": "1080p"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "wan-2.7-text-to-video"
}
Utiliser Wan dans Hermes Agent en trois étapes
Configurer RunAPI
Définissez RUNAPI_API_KEY dans l'environnement où Hermes Agent s'exécute. Si vous avez déjà ajouté RunAPI comme fournisseur custom:runapi, la même clé et base_url gèrent tous les endpoints Wan — aucune configuration supplémentaire requise.
export RUNAPI_API_KEY=runapi_xxx
Appeler un endpoint Wan
Envoyez une requête POST à text_to_video avec le modèle défini sur wan-2.7-text-to-video et output_resolution à 720p ou 1080p. Pour image-to-video, utilisez wan-2.7-image-to-video avec first_frame_image_url. Pour la vidéo pilotée par la voix, utilisez wan-2.2-a14b-speech-to-video-turbo avec source_audio_url et source_image_url. Hermes Agent route toutes les requêtes via le fournisseur custom:runapi.
POST /api/v1/task/text_to_video
Obtenir le résultat
L'endpoint retourne immédiatement un task_id. Interrogez l'endpoint de statut de tâche jusqu'à ce que le statut soit completed, puis lisez l'URL de la vidéo ou de l'image de sortie depuis la réponse. Les SDK et la CLI RunAPI gèrent le polling automatiquement.
GET /api/v1/task/text_to_video/tsk_abc123
Paramètres API text_to_video de Wan
| Paramètre | Type | Description |
|---|---|---|
model |
string |
Requis. wan-2.7-text-to-video, wan-2.6-text-to-video, wan-2.5-text-to-video, wan-2.2-a14b-text-to-video-turbo ou wan-2.7-r2v. |
prompt |
string |
Requis. Description textuelle de la scène vidéo souhaitée, incluant le mouvement de caméra, l'éclairage et le détail du sujet. |
output_resolution |
string |
Optionnel. 720p ou 1080p pour Wan 2.5+. Wan 2.2 accepte aussi 480p et 580p. Par défaut 720p. |
aspect_ratio |
string |
Optionnel. Pour wan-2.7-r2v uniquement. Valeurs acceptées : 16:9, 9:16, 1:1, 4:3, 3:4. |
duration_seconds |
integer |
Optionnel. Pour wan-2.7-r2v uniquement. Durée de la vidéo en secondes, de 2 à 10. |
seed |
integer |
Optionnel. Graine de reproductibilité pour une sortie déterministe. |
callback_url |
string |
Optionnel. URL webhook qui reçoit un POST lorsque la tâche se termine. |
Qu'est-ce que Wan sur Hermes Agent ?
Wan d'Alibaba est un modèle vidéo open source Apache 2.0 qui mène le classement Artificial Analysis pour la qualité texte-vers-vidéo. Via le fournisseur custom:runapi de Hermes Agent, il couvre 20+ variantes -- texte-vers-vidéo, image-vers-vidéo, parole-vers-vidéo avec synchronisation labiale et édition vidéo. Ses poids ouverts signifient que vous pouvez également l'héberger vous-même si votre workflow requiert la confidentialité des données, tandis que RunAPI gère l'infrastructure GPU pour une utilisation hébergée.
Cas d'utilisation de Wan
Contenu de marque en volume
Utiliser la cohérence des personnages de Wan et les crédits non expirables pour produire du contenu vidéo de marque à grande échelle. Hermes Agent peut distribuer des tâches de génération parallèles sur différentes lignes de produits.
Contenu riche en dialogue avec synchronisation labiale
Enchaîner ElevenLabs TTS avec l'endpoint parole-vers-vidéo de Wan dans un workflow Hermes Agent pour passer d'un script texte à une vidéo parlante synchronisée sur les lèvres sans étapes manuelles.
Pré-visualisation pour cinéastes et agences
Générer des clips de pré-visualisation de qualité production avec des images clés ancrées aux extrémités. Définir des images de premier et dernier plan pour contrôler les transitions de scènes exactes pour la revue client.
Questions sur Wan + Hermes Agent
Tous. text_to_video, image_to_video, speech_to_video, text_to_image (Wan 2.7 Image), edit_video et animate. Configurez RunAPI comme fournisseur custom:runapi une fois, puis changez les endpoints et les slugs de modèles par requête — par exemple wan-2.7-text-to-video pour la vidéo et wan-2.7-image pour la génération d'images jusqu'à 4K.
Ajoutez une entrée de fournisseur personnalisé nommée runapi dans votre configuration Hermes Agent avec base_url défini sur https://runapi.ai/v1 et votre RUNAPI_API_KEY comme clé API. Une fois configuré, le même fournisseur gère tous les endpoints Wan — et tous les 113+ modèles RunAPI — sans plugins supplémentaires.
Wan 2.5 a introduit la sortie 1080p. Wan 2.6 a ajouté l'édition vidéo (R2V) et des variantes flash pour une génération plus rapide. Wan 2.7 ajoute la génération d'images (wan-2.7-image, wan-2.7-image-pro jusqu'à 4K), l'édition vidéo (wan-2.7-edit-video) et une qualité text-to-video améliorée qui mène le classement Artificial Analysis.
Utilisez wan-2.2-a14b-speech-to-video-turbo avec source_audio_url (le fichier audio) et source_image_url (le visage à animer). Wan génère une vidéo synchronisée avec les lèvres où le visage parle l'audio. La résolution de sortie supporte 480p, 580p ou 720p.
Oui. Wan est publié sous Apache 2.0 par Alibaba et les poids du modèle sont publiquement disponibles. Via RunAPI, vous évitez la configuration GPU — un seul appel API génère des vidéos ou des images. Si vous avez besoin d'un pipeline auto-hébergé pour la confidentialité, les mêmes poids fonctionnent sur votre propre infrastructure.
Configuration générale de Hermes Agent
Pas encore configuré ? Commencez par le guide de configuration RunAPI pour Hermes Agent.
Guide de configuration Hermes Agent →Catalogue des modèles Wan
Voir les 20+ variantes de Wan, les niveaux de tarification et la documentation des endpoints.
Wan sur RunAPI →Essayez Wan dans Hermes Agent dès aujourd'hui.
Obtenez une clé RunAPI gratuite, configurez le fournisseur custom:runapi et générez des vidéos avec le modèle open source classé #1 — text-to-video, image-to-video ou speech-to-video.