Utiliser InfiniteTalk dans Hermes Agent.
InfiniteTalk génère des vidéos d'avatars parlants avec lip-sync à partir d'un fichier audio et d'une image de visage. Hermes Agent l'appelle via l'endpoint personnalisé RunAPI — configurez custom:runapi une fois, envoyez audio_to_video et interrogez pour la vidéo terminée.
Use RunAPI to generate a talking avatar video with InfiniteTalk.
Requirements:
- Read the API key from RUNAPI_API_KEY.
- Use the custom:runapi provider with base_url https://runapi.ai/v1.
- Call POST https://runapi.ai/api/v1/infinitetalk/audio_to_video
- Set model to "infinitetalk-from-audio".
- Set source_audio_url to the URL of the audio file.
- Set source_image_url to the URL of the face image.
- Set prompt to describe the desired output.
- The task is async. Poll the returned task_id until status is "completed".
- When done, read the video URL from the response output.
curl -X POST https://runapi.ai/api/v1/infinitetalk/audio_to_video \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "infinitetalk-from-audio",
"source_audio_url": "https://example.com/speech.mp3",
"source_image_url": "https://example.com/avatar.jpg",
"prompt": "A professional presenter delivering a product overview"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "infinitetalk-from-audio"
}
Utiliser InfiniteTalk dans Hermes Agent en trois étapes
Configurer RunAPI
Définissez RUNAPI_API_KEY dans l'environnement où Hermes Agent s'exécute. Si vous avez déjà ajouté RunAPI comme fournisseur custom:runapi, la même clé gère les requêtes InfiniteTalk.
export RUNAPI_API_KEY=runapi_xxx
Appeler InfiniteTalk
Envoyez une requête POST à l'endpoint audio_to_video avec le modèle, l'URL audio, l'URL de l'image et un prompt. Hermes Agent peut construire et envoyer cette requête via le fournisseur custom:runapi.
POST /api/v1/infinitetalk/audio_to_video
Interroger pour le résultat
L'endpoint retourne immédiatement un task_id. Interrogez l'endpoint de statut de tâche jusqu'à ce que le statut soit completed, puis lisez l'URL de la vidéo de sortie depuis la réponse.
GET /api/v1/infinitetalk/audio_to_video/tsk_abc123
Paramètres API de InfiniteTalk
| Paramètre | Type | Description |
|---|---|---|
model |
string |
Requis. Utilisez infinitetalk-from-audio. |
source_audio_url |
string |
Requis. URL du fichier audio source pour le lip-sync. |
source_image_url |
string |
Requis. URL de l'image de visage ou d'avatar à animer. |
prompt |
string |
Requis. Description textuelle de la sortie vidéo souhaitée. Maximum 5000 caractères. |
output_resolution |
string |
Optionnel. Résolution de la vidéo de sortie. Valeurs acceptées : 480p, 720p. Par défaut 480p. |
seed |
integer |
Optionnel. Graine de reproductibilité. Entier entre 10000 et 1000000. |
callback_url |
string |
Optionnel. URL webhook qui reçoit un POST lorsque la tâche se termine. |
Qu'est-ce qu'InfiniteTalk sur Hermes Agent ?
InfiniteTalk crée des vidéos d'avatar parlant en pilotant l'animation du visage, la synchronisation labiale et les mouvements de tête depuis un fichier audio et une image de référence. Hermes Agent l'appelle via le fournisseur custom:runapi pour construire des pipelines multi-étapes -- par exemple, générer de la parole avec ElevenLabs puis transmettre l'URL audio à InfiniteTalk pour un workflow complet de texte-vers-vidéo-parlante.
Cas d'utilisation d'InfiniteTalk
Contenu YouTube avec des présentateurs IA
Générer des vidéos talking head à partir d'une seule photo pour des chaînes YouTube, éliminant le besoin de tournage en caméra tout en conservant un présentateur cohérent sur toutes les vidéos.
Doublage vidéo avec synchronisation labiale
Réanimer les visages dans des vidéos existantes pour correspondre à de nouvelles pistes audio dans différentes langues, produisant du contenu doublé où les mouvements de bouche correspondent au discours traduit.
Vidéos longues de cours et présentations
Créer des vidéos d'avatar parlant de durée illimitée à partir d'une narration enregistrée pour des cours en ligne, webinaires ou formations internes en utilisant juste une photo d'instructeur.
Questions sur InfiniteTalk + Hermes Agent
Oui. Hermes Agent peut appeler l'endpoint RunAPI InfiniteTalk via le fournisseur custom:runapi. Définissez RUNAPI_API_KEY dans votre environnement et envoyez un POST à /api/v1/infinitetalk/audio_to_video avec le modèle, l'URL audio et l'URL de l'image.
Non. La même RUNAPI_API_KEY que vous utilisez pour le chat, la génération d'images et de vidéos fonctionne également pour InfiniteTalk. Tous les modèles RunAPI partagent une seule clé et un seul solde de crédits.
Asynchrone. L'endpoint de création retourne immédiatement un task_id. Interrogez l'endpoint de statut de tâche ou fournissez une callback_url pour recevoir un webhook lorsque la vidéo est prête.
InfiniteTalk utilise une facturation par tâche. Consultez la page des tarifs RunAPI pour les tarifs actuels. Les crédits sont déduits du même solde utilisé pour tous les modèles RunAPI.
Configuration générale de Hermes Agent
Pas encore configuré ? Commencez par le guide de configuration RunAPI pour Hermes Agent.
Guide de configuration Hermes Agent →Catalogue des modèles InfiniteTalk
Voir les variantes, les tarifs et la documentation API de InfiniteTalk.
InfiniteTalk sur RunAPI →Essayez InfiniteTalk dans Hermes Agent dès aujourd'hui.
Obtenez une clé RunAPI gratuite, configurez le fournisseur custom:runapi et générez des vidéos d'avatars parlants avec lip-sync depuis n'importe quel fichier audio.