Usa InfiniteTalk in Hermes Agent.
InfiniteTalk genera video di avatar parlante con lip-sync da un file audio e un'immagine del viso. Hermes Agent lo chiama tramite l'endpoint RunAPI personalizzato — configura custom:runapi una volta, invia audio_to_video e attendi il video completato.
Use RunAPI to generate a talking avatar video with InfiniteTalk.
Requirements:
- Read the API key from RUNAPI_API_KEY.
- Use the custom:runapi provider with base_url https://runapi.ai/v1.
- Call POST https://runapi.ai/api/v1/infinitetalk/audio_to_video
- Set model to "infinitetalk-from-audio".
- Set source_audio_url to the URL of the audio file.
- Set source_image_url to the URL of the face image.
- Set prompt to describe the desired output.
- The task is async. Poll the returned task_id until status is "completed".
- When done, read the video URL from the response output.
curl -X POST https://runapi.ai/api/v1/infinitetalk/audio_to_video \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "infinitetalk-from-audio",
"source_audio_url": "https://example.com/speech.mp3",
"source_image_url": "https://example.com/avatar.jpg",
"prompt": "A professional presenter delivering a product overview"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "infinitetalk-from-audio"
}
Usa InfiniteTalk in Hermes Agent in tre passaggi
Configura RunAPI
Imposta RUNAPI_API_KEY nell'ambiente in cui viene eseguito Hermes Agent. Se hai già aggiunto RunAPI come provider custom:runapi, la stessa key gestisce le richieste InfiniteTalk.
export RUNAPI_API_KEY=runapi_xxx
Chiama InfiniteTalk
Invia una richiesta POST all'endpoint audio_to_video con il model, l'URL dell'audio, l'URL dell'immagine e un prompt. Hermes Agent può costruire e inviare questa richiesta tramite il provider custom:runapi.
POST /api/v1/infinitetalk/audio_to_video
Attendi il risultato
L'endpoint restituisce immediatamente un task_id. Esegui il polling dell'endpoint di stato del task finché lo stato non è completed, poi leggi l'URL del video di output dalla risposta.
GET /api/v1/infinitetalk/audio_to_video/tsk_abc123
Parametri API InfiniteTalk
| Parametro | Tipo | Descrizione |
|---|---|---|
model |
string |
Obbligatorio. Usa infinitetalk-from-audio. |
source_audio_url |
string |
Obbligatorio. URL del file audio sorgente per il lip-sync. |
source_image_url |
string |
Obbligatorio. URL dell'immagine del viso o avatar da animare. |
prompt |
string |
Obbligatorio. Descrizione testuale dell'output video desiderato. Massimo 5000 caratteri. |
output_resolution |
string |
Facoltativo. Risoluzione del video di output. Valori accettati: 480p, 720p. Predefinito: 480p. |
seed |
integer |
Facoltativo. Seed per la riproducibilità. Intero tra 10000 e 1000000. |
callback_url |
string |
Facoltativo. URL webhook che riceve un POST al completamento del task. |
Cos'è InfiniteTalk su Hermes Agent?
InfiniteTalk crea video di avatar parlante guidando l'animazione del viso, la sincronizzazione delle labbra e il movimento della testa da un file audio e un'immagine di riferimento. Hermes Agent lo chiama tramite il provider custom:runapi per costruire pipeline multi-step -- ad esempio, generare il parlato con ElevenLabs e poi passare l'URL audio a InfiniteTalk per un workflow completo da testo a video parlante.
Casi d'uso di InfiniteTalk
Contenuto YouTube con presentatori IA
Generare video talking head da una singola foto per canali YouTube, eliminando la necessità di riprese in telecamera mantenendo un presentatore coerente in tutti i video.
Doppiaggio video con sincronizzazione labiale
Rianimare i volti nei video esistenti per corrispondere a nuove tracce audio in lingue diverse, producendo contenuto doppiato dove i movimenti della bocca corrispondono al discorso tradotto.
Video lunghi di lezioni e presentazioni
Creare video di avatar parlante di durata illimitata da narrazione registrata per corsi online, webinar o contenuto di formazione interno usando solo una foto dell'istruttore.
Domande su InfiniteTalk + Hermes Agent
Sì. Hermes Agent può chiamare l'endpoint RunAPI InfiniteTalk tramite il provider custom:runapi. Imposta RUNAPI_API_KEY nel tuo ambiente e invia un POST a /api/v1/infinitetalk/audio_to_video con il model, l'URL dell'audio e l'URL dell'immagine.
No. La stessa RUNAPI_API_KEY che usi per chat, generazione di immagini e video funziona anche per InfiniteTalk. Tutti i modelli RunAPI condividono una sola key e un saldo crediti.
Asincrono. L'endpoint di creazione restituisce immediatamente un task_id. Esegui il polling dell'endpoint di stato del task o fornisci un callback_url per ricevere un webhook quando il video è pronto.
InfiniteTalk usa la fatturazione per task. Controlla la pagina dei prezzi di RunAPI per le tariffe aggiornate. I crediti vengono detratti dallo stesso saldo usato per tutti i modelli RunAPI.
Configurazione generale di Hermes Agent
Non ancora configurato? Inizia con la guida di configurazione RunAPI per Hermes Agent.
Guida di configurazione di Hermes Agent →Catalogo modelli InfiniteTalk
Vedi le varianti, i prezzi e la documentazione API di InfiniteTalk.
InfiniteTalk su RunAPI →Prova InfiniteTalk in Hermes Agent oggi.
Ottieni una API key RunAPI gratuita, configura il provider custom:runapi e genera video di avatar parlante con lip-sync da qualsiasi file audio.