InfiniteTalk in Hermes Agent verwenden.
InfiniteTalk generiert lippensynchronisierte Talking-Avatar-Videos aus einer Audiodatei und einem Gesichtsbild. Hermes Agent ruft es ueber den RunAPI-Custom-Endpunkt auf — custom:runapi einmal konfigurieren, audio_to_video senden und auf das fertige Video warten.
Use RunAPI to generate a talking avatar video with InfiniteTalk.
Requirements:
- Read the API key from RUNAPI_API_KEY.
- Use the custom:runapi provider with base_url https://runapi.ai/v1.
- Call POST https://runapi.ai/api/v1/infinitetalk/audio_to_video
- Set model to "infinitetalk-from-audio".
- Set source_audio_url to the URL of the audio file.
- Set source_image_url to the URL of the face image.
- Set prompt to describe the desired output.
- The task is async. Poll the returned task_id until status is "completed".
- When done, read the video URL from the response output.
curl -X POST https://runapi.ai/api/v1/infinitetalk/audio_to_video \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "infinitetalk-from-audio",
"source_audio_url": "https://example.com/speech.mp3",
"source_image_url": "https://example.com/avatar.jpg",
"prompt": "A professional presenter delivering a product overview"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "infinitetalk-from-audio"
}
InfiniteTalk in Hermes Agent in drei Schritten verwenden
RunAPI konfigurieren
RUNAPI_API_KEY in der Umgebung setzen, in der Hermes Agent laeuft. Wenn RunAPI bereits als custom:runapi-Provider eingerichtet ist, verarbeitet derselbe Key auch InfiniteTalk-Requests.
export RUNAPI_API_KEY=runapi_xxx
InfiniteTalk aufrufen
Einen POST-Request an den audio_to_video-Endpunkt mit dem Modell, der Audio-URL, der Bild-URL und einem Prompt senden. Hermes Agent kann diesen Request ueber den custom:runapi-Provider erstellen und senden.
POST /api/v1/infinitetalk/audio_to_video
Ergebnis abfragen
Der Endpunkt gibt sofort eine task_id zurueck. Den Task-Status-Endpunkt abfragen, bis der Status completed ist, dann die Video-URL aus der Antwort auslesen.
GET /api/v1/infinitetalk/audio_to_video/tsk_abc123
InfiniteTalk API-Parameter
| Parameter | Typ | Beschreibung |
|---|---|---|
model |
string |
Erforderlich. infinitetalk-from-audio verwenden. |
source_audio_url |
string |
Erforderlich. URL der Quell-Audiodatei fuer die Lippensynchronisation. |
source_image_url |
string |
Erforderlich. URL des Gesichts- oder Avatar-Bildes zur Animation. |
prompt |
string |
Erforderlich. Textbeschreibung der gewuenschten Videoausgabe. Maximal 5000 Zeichen. |
output_resolution |
string |
Optional. Videoaufloesung der Ausgabe. Akzeptierte Werte: 480p, 720p. Standard ist 480p. |
seed |
integer |
Optional. Reproduzierbarkeitswert. Ganzzahl zwischen 10000 und 1000000. |
callback_url |
string |
Optional. Webhook-URL, die einen POST empfaengt, wenn der Task abgeschlossen ist. |
Was ist InfiniteTalk mit Hermes Agent?
InfiniteTalk erstellt Talking-Avatar-Videos, indem es Gesichtsanimation, Mundsynchronisierung und Kopfbewegung aus einer Audiodatei und einem Referenzbild steuert. Hermes Agent ruft es über den custom:runapi-Provider auf, um mehrstufige Pipelines zu bauen – zum Beispiel Sprache mit ElevenLabs generieren und dann die Audio-URL für einen vollständigen Text-zu-Talking-Video-Workflow an InfiniteTalk weitergeben.
InfiniteTalk Anwendungsfälle
YouTube-Content mit KI-Presentern
Talking-Head-Videos aus einem einzelnen Foto für YouTube-Kanäle generieren und so die Notwendigkeit für On-Camera-Aufnahmen eliminieren, während ein konsistenter Presenter über alle Videos hinweg beibehalten wird.
Video-Synchronisation mit Lippensync
Gesichter in bestehenden Videos neu animieren, um neue Audio-Tracks in verschiedenen Sprachen zu synchronisieren und synchronisierten Content zu produzieren, bei dem Mundbewegungen zur übersetzten Sprache passen.
Long-Form-Vorlesungs- und Präsentationsvideos
Talking-Avatar-Videos in unbegrenzter Länge aus aufgezeichneter Narration für Online-Kurse, Webinare oder internes Schulungsmaterial mit nur einem Dozentenfoto erstellen.
InfiniteTalk + Hermes Agent — Fragen
Ja. Hermes Agent kann den RunAPI InfiniteTalk-Endpunkt ueber den custom:runapi-Provider aufrufen. RUNAPI_API_KEY in der Umgebung setzen und einen POST an /api/v1/infinitetalk/audio_to_video mit dem Modell, der Audio-URL und der Bild-URL senden.
Nein. Derselbe RUNAPI_API_KEY fuer Chat, Bild- und Videogenerierung funktioniert auch fuer InfiniteTalk. Alle RunAPI-Modelle teilen sich einen Key und ein Guthaben.
Asynchron. Der Erstellungs-Endpunkt gibt sofort eine task_id zurueck. Den Task-Status-Endpunkt abfragen oder eine callback_url angeben, um einen Webhook zu erhalten, wenn das Video fertig ist.
InfiniteTalk wird pro Task abgerechnet. Aktuelle Preise auf der RunAPI-Preisseite. Das Guthaben wird vom selben Konto abgezogen wie fuer alle RunAPI-Modelle.
Hermes Agent Grundeinrichtung
Noch nicht eingerichtet? Mit der RunAPI-Einrichtungsanleitung fuer Hermes Agent starten.
Hermes Agent Einrichtungsanleitung →InfiniteTalk Modellkatalog
InfiniteTalk-Varianten, Preise und API-Dokumentation ansehen.
InfiniteTalk bei RunAPI →InfiniteTalk in Hermes Agent noch heute ausprobieren.
Einen kostenlosen RunAPI-Key holen, den custom:runapi-Provider konfigurieren und lippensynchronisierte Talking-Avatar-Videos aus beliebigen Audiodateien generieren.