HERMES + INFINITETALK

Utiliser InfiniteTalk dans Hermes Agent.

InfiniteTalk génère des vidéos d'avatars parlants avec lip-sync à partir d'un fichier audio et d'une image de visage. Hermes Agent l'appelle via l'endpoint personnalisé RunAPI — configurez custom:runapi une fois, envoyez audio_to_video et interrogez pour la vidéo terminée.

une seule clé API · endpoint audio-to-video · polling de tâche asynchrone
Use RunAPI to generate a talking avatar video with InfiniteTalk.

Requirements:
- Read the API key from RUNAPI_API_KEY.
- Use the custom:runapi provider with base_url https://runapi.ai/v1.
- Call POST https://runapi.ai/api/v1/infinitetalk/audio_to_video
- Set model to "infinitetalk-from-audio".
- Set source_audio_url to the URL of the audio file.
- Set source_image_url to the URL of the face image.
- Set prompt to describe the desired output.
- The task is async. Poll the returned task_id until status is "completed".
- When done, read the video URL from the response output.
curl -X POST https://runapi.ai/api/v1/infinitetalk/audio_to_video \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "infinitetalk-from-audio",
    "source_audio_url": "https://example.com/speech.mp3",
    "source_image_url": "https://example.com/avatar.jpg",
    "prompt": "A professional presenter delivering a product overview"
  }'
{
  "task_id": "tsk_abc123",
  "status": "pending",
  "model": "infinitetalk-from-audio"
}
Copiez la commande curl pour tester infinitetalk
FONCTIONNEMENT

Utiliser InfiniteTalk dans Hermes Agent en trois étapes

1

Configurer RunAPI

Définissez RUNAPI_API_KEY dans l'environnement où Hermes Agent s'exécute. Si vous avez déjà ajouté RunAPI comme fournisseur custom:runapi, la même clé gère les requêtes InfiniteTalk.

export RUNAPI_API_KEY=runapi_xxx
2

Appeler InfiniteTalk

Envoyez une requête POST à l'endpoint audio_to_video avec le modèle, l'URL audio, l'URL de l'image et un prompt. Hermes Agent peut construire et envoyer cette requête via le fournisseur custom:runapi.

POST /api/v1/infinitetalk/audio_to_video
3

Interroger pour le résultat

L'endpoint retourne immédiatement un task_id. Interrogez l'endpoint de statut de tâche jusqu'à ce que le statut soit completed, puis lisez l'URL de la vidéo de sortie depuis la réponse.

GET /api/v1/infinitetalk/audio_to_video/tsk_abc123
PARAMÈTRES

Paramètres API de InfiniteTalk

Paramètre Type Description
model string Requis. Utilisez infinitetalk-from-audio.
source_audio_url string Requis. URL du fichier audio source pour le lip-sync.
source_image_url string Requis. URL de l'image de visage ou d'avatar à animer.
prompt string Requis. Description textuelle de la sortie vidéo souhaitée. Maximum 5000 caractères.
output_resolution string Optionnel. Résolution de la vidéo de sortie. Valeurs acceptées : 480p, 720p. Par défaut 480p.
seed integer Optionnel. Graine de reproductibilité. Entier entre 10000 et 1000000.
callback_url string Optionnel. URL webhook qui reçoit un POST lorsque la tâche se termine.

Qu'est-ce qu'InfiniteTalk sur Hermes Agent ?

InfiniteTalk crée des vidéos d'avatar parlant en pilotant l'animation du visage, la synchronisation labiale et les mouvements de tête depuis un fichier audio et une image de référence. Hermes Agent l'appelle via le fournisseur custom:runapi pour construire des pipelines multi-étapes -- par exemple, générer de la parole avec ElevenLabs puis transmettre l'URL audio à InfiniteTalk pour un workflow complet de texte-vers-vidéo-parlante.

Cas d'utilisation d'InfiniteTalk

Contenu YouTube avec des présentateurs IA

Générer des vidéos talking head à partir d'une seule photo pour des chaînes YouTube, éliminant le besoin de tournage en caméra tout en conservant un présentateur cohérent sur toutes les vidéos.

Doublage vidéo avec synchronisation labiale

Réanimer les visages dans des vidéos existantes pour correspondre à de nouvelles pistes audio dans différentes langues, produisant du contenu doublé où les mouvements de bouche correspondent au discours traduit.

Vidéos longues de cours et présentations

Créer des vidéos d'avatar parlant de durée illimitée à partir d'une narration enregistrée pour des cours en ligne, webinaires ou formations internes en utilisant juste une photo d'instructeur.

FAQ

Questions sur InfiniteTalk + Hermes Agent

Configuration générale de Hermes Agent

Pas encore configuré ? Commencez par le guide de configuration RunAPI pour Hermes Agent.

Guide de configuration Hermes Agent →

Catalogue des modèles InfiniteTalk

Voir les variantes, les tarifs et la documentation API de InfiniteTalk.

InfiniteTalk sur RunAPI →

Essayez InfiniteTalk dans Hermes Agent dès aujourd'hui.

Obtenez une clé RunAPI gratuite, configurez le fournisseur custom:runapi et générez des vidéos d'avatars parlants avec lip-sync depuis n'importe quel fichier audio.