HERMES + INFINITETALK

InfiniteTalk in Hermes Agent verwenden.

InfiniteTalk generiert lippensynchronisierte Talking-Avatar-Videos aus einer Audiodatei und einem Gesichtsbild. Hermes Agent ruft es ueber den RunAPI-Custom-Endpunkt auf — custom:runapi einmal konfigurieren, audio_to_video senden und auf das fertige Video warten.

ein API-Key · Audio-to-Video-Endpunkt · asynchrones Task-Polling
Use RunAPI to generate a talking avatar video with InfiniteTalk.


      Requirements:

      - Read the API key from RUNAPI_API_KEY.

      - Use the custom:runapi provider with base_url https://runapi.ai/v1.

      - Call POST https://runapi.ai/api/v1/infinitetalk/audio_to_video

      - Set model to "infinitetalk-from-audio".

      - Set source_audio_url to the URL of the audio file.

      - Set source_image_url to the URL of the face image.

      - Set prompt to describe the desired output.

      - The task is async. Poll the returned task_id until status is "completed".

      - When done, read the video URL from the response output.

      
curl -X POST https://runapi.ai/api/v1/infinitetalk/audio_to_video \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "infinitetalk-from-audio",
    "source_audio_url": "https://example.com/speech.mp3",
    "source_image_url": "https://example.com/avatar.jpg",
    "prompt": "A professional presenter delivering a product overview"
  }'
{
  "task_id": "tsk_abc123",
  "status": "pending",
  "model": "infinitetalk-from-audio"
}
Den curl-Befehl kopieren und testen infinitetalk
SO FUNKTIONIERT ES

InfiniteTalk in Hermes Agent in drei Schritten verwenden

1

RunAPI konfigurieren

RUNAPI_API_KEY in der Umgebung setzen, in der Hermes Agent laeuft. Wenn RunAPI bereits als custom:runapi-Provider eingerichtet ist, verarbeitet derselbe Key auch InfiniteTalk-Requests.

export RUNAPI_API_KEY=runapi_xxx
2

InfiniteTalk aufrufen

Einen POST-Request an den audio_to_video-Endpunkt mit dem Modell, der Audio-URL, der Bild-URL und einem Prompt senden. Hermes Agent kann diesen Request ueber den custom:runapi-Provider erstellen und senden.

POST /api/v1/infinitetalk/audio_to_video
3

Ergebnis abfragen

Der Endpunkt gibt sofort eine task_id zurueck. Den Task-Status-Endpunkt abfragen, bis der Status completed ist, dann die Video-URL aus der Antwort auslesen.

GET /api/v1/infinitetalk/audio_to_video/tsk_abc123
PARAMETER

InfiniteTalk API-Parameter

Parameter Typ Beschreibung
model string Erforderlich. infinitetalk-from-audio verwenden.
source_audio_url string Erforderlich. URL der Quell-Audiodatei fuer die Lippensynchronisation.
source_image_url string Erforderlich. URL des Gesichts- oder Avatar-Bildes zur Animation.
prompt string Erforderlich. Textbeschreibung der gewuenschten Videoausgabe. Maximal 5000 Zeichen.
output_resolution string Optional. Videoaufloesung der Ausgabe. Akzeptierte Werte: 480p, 720p. Standard ist 480p.
seed integer Optional. Reproduzierbarkeitswert. Ganzzahl zwischen 10000 und 1000000.
callback_url string Optional. Webhook-URL, die einen POST empfaengt, wenn der Task abgeschlossen ist.

Was ist InfiniteTalk mit Hermes Agent?

InfiniteTalk erstellt Talking-Avatar-Videos, indem es Gesichtsanimation, Mundsynchronisierung und Kopfbewegung aus einer Audiodatei und einem Referenzbild steuert. Hermes Agent ruft es über den custom:runapi-Provider auf, um mehrstufige Pipelines zu bauen – zum Beispiel Sprache mit ElevenLabs generieren und dann die Audio-URL für einen vollständigen Text-zu-Talking-Video-Workflow an InfiniteTalk weitergeben.

InfiniteTalk Anwendungsfälle

YouTube-Content mit KI-Presentern

Talking-Head-Videos aus einem einzelnen Foto für YouTube-Kanäle generieren und so die Notwendigkeit für On-Camera-Aufnahmen eliminieren, während ein konsistenter Presenter über alle Videos hinweg beibehalten wird.

Video-Synchronisation mit Lippensync

Gesichter in bestehenden Videos neu animieren, um neue Audio-Tracks in verschiedenen Sprachen zu synchronisieren und synchronisierten Content zu produzieren, bei dem Mundbewegungen zur übersetzten Sprache passen.

Long-Form-Vorlesungs- und Präsentationsvideos

Talking-Avatar-Videos in unbegrenzter Länge aus aufgezeichneter Narration für Online-Kurse, Webinare oder internes Schulungsmaterial mit nur einem Dozentenfoto erstellen.

FAQ

InfiniteTalk + Hermes Agent — Fragen

Hermes Agent Grundeinrichtung

Noch nicht eingerichtet? Mit der RunAPI-Einrichtungsanleitung fuer Hermes Agent starten.

Hermes Agent Einrichtungsanleitung →

InfiniteTalk Modellkatalog

InfiniteTalk-Varianten, Preise und API-Dokumentation ansehen.

InfiniteTalk bei RunAPI →

InfiniteTalk in Hermes Agent noch heute ausprobieren.

Einen kostenlosen RunAPI-Key holen, den custom:runapi-Provider konfigurieren und lippensynchronisierte Talking-Avatar-Videos aus beliebigen Audiodateien generieren.