Kling in Hermes Agent verwenden.
Kling 3.0 von Kuaishou generiert Videos aus Text oder Bildern mit bis zu 1080p, nativem Audio, Multi-Shot-Szenen und 3–15 Sekunden Dauer. Hermes Agent ruft es über RunAPI mit dem custom:runapi-Provider auf — derselbe Key und dieselbe Base-URL wie für Chat.
RunAPI verwenden, um ein Video mit Kling 3.0 über Hermes Agent zu generieren.
Requirements:
- Use the custom:runapi provider already configured in Hermes Agent
- Call POST https://runapi.ai/api/v1/kling/text_to_video
- Set model to "kling-3.0"
- The RUNAPI_API_KEY environment variable provides authorization
- Set duration_seconds to control length (3–15 seconds)
- Set aspect_ratio to "16:9" for landscape video
- Enable sound with enable_sound: true for native audio
- The response is async — poll the task status endpoint until the task completes, then retrieve the video URL
curl -X POST https://runapi.ai/api/v1/kling/text_to_video \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "kling-3.0",
"prompt": "A drone shot pulling back from a mountain lake at sunrise, mist rising off the water, cinematic lighting",
"duration_seconds": 5,
"aspect_ratio": "16:9",
"enable_sound": true,
"output_resolution": "1080p"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "kling-3.0"
}
Kling in Hermes Agent in drei Schritten verwenden
RunAPI konfigurieren
Die RUNAPI_API_KEY-Umgebungsvariable setzen. Wenn RunAPI bereits als custom:runapi-Provider in Hermes Agent für Chat hinzugefügt wurde, funktionieren derselbe Key und dieselbe base_url für die Videogenerierung — keine zusätzliche Konfiguration nötig.
export RUNAPI_API_KEY=runapi_xxx
Kling text_to_video aufrufen
Einen POST-Request an /api/v1/kling/text_to_video mit model kling-3.0 senden. Einen Prompt, duration_seconds (3–15), aspect_ratio und optional enable_sound für nativen Audio angeben. Für bildgesteuerte Generierung /api/v1/kling/image_to_video mit first_frame_image_url verwenden.
POST /api/v1/kling/text_to_video
Ergebnis abrufen
Der Endpunkt gibt sofort eine task_id zurück. Den Task-Status-Endpunkt abfragen, bis der Status auf completed wechselt, dann die Video-URL aus der Antwort abrufen. Die Generierung dauert typischerweise 30–120 Sekunden je nach Dauer und Auflösung.
GET /api/v1/kling/text_to_video/tsk_abc123
Kling text_to_video API-Parameter
| Parameter | Typ | Beschreibung |
|---|---|---|
model |
string |
Erforderlich. kling-3.0 für die neueste Version. |
prompt |
string |
Videobeschreibung. Erforderlich, außer multi_shots ist aktiviert. |
duration_seconds |
integer |
Videolänge. Kling 3.0 unterstützt 3–15 Sekunden. Ältere Versionen akzeptieren 5 oder 10. |
aspect_ratio |
string |
Ausgabe-Seitenverhältnis: 16:9, 9:16 oder 1:1. |
output_resolution |
string |
Auflösung: 720p, 1080p oder 4k. Höhere Auflösung kostet mehr pro Sekunde. |
enable_sound |
boolean |
Nativen Audio neben dem Video generieren. Erhöht die Kosten pro Sekunde. |
negative_prompt |
string |
Elemente, die von der Generierung ausgeschlossen werden sollen. |
first_frame_image_url |
string |
Bild-URL als Eröffnungsframe (Einzelaufnahme-Modus). |
cfg_scale |
number |
Guidance-Skala (0–1). Höhere Werte folgen dem Prompt enger. |
multi_shots |
boolean |
Multi-Shot-Szenegenerierung mit separaten Prompts pro Segment aktivieren. |
Was ist Kling mit Hermes Agent?
Kling 3.0 von Kuaishou liefert kinematische Clips mit Charakterkonsistenz und starker Bewegungsphysik – Tuchfaltung, Fluiddynamik und realistische Kamerabewegung. Über den Hermes-Agent-custom:runapi-Provider erhält man Text-zu-Video und Bild-zu-Video bei bis zu 1080p mit nativem Audio und generiert Clips von 3 bis 15 Sekunden (oder bis zu 3 Minuten mit Mehrfach-Shot-Modus).
Kling Anwendungsfälle
Längerer narrativer Content
Klings Mehrfach-Shot-Modus verwenden, um szenenlange Aufnahmen von bis zu 3 Minuten aufzubauen und Establishing Shots und Charaktersequenzen mit konsistenten Visuals über Segmente hinweg zu verbinden.
Reise- und Natur-Content
Reisevlog-B-Roll und Naturaufnahmen mit realistischem Umgebungsrendering generieren. Kling verarbeitet Wasser, Nebel und atmosphärische Beleuchtung gut für Außenszenen.
Produkt-Demo-Videos
Ein Produktbild in ein kurzes Video mit Kamerabewegung und natürlichen Beleuchtungsübergängen animieren – nützlich für E-Commerce-Listings und Social Ads.
Kling + Hermes Agent — Fragen
Kling berechnet pro Sekunde generiertes Video. Der Preis hängt von output_resolution und enable_sound ab. Ein 5-Sekunden-720p-Clip ohne Sound ist die günstigste Option; 1080p mit Sound kostet ungefähr doppelt so viel pro Sekunde. Aktuelle Preise auf der RunAPI-Preisseite.
text_to_video generiert einen Clip allein aus einem Textprompt. image_to_video benötigt eine first_frame_image_url und animiert ab diesem Bild. Beide Endpunkte geben eine asynchrone task_id zurück und unterstützen dieselben Dauer- und Auflösungsoptionen.
Ja. RunAPI hostet auch kling-v2.5-turbo-text-to-video-pro und kling-v2.5-turbo-image-to-video-pro für schnellere, kostengünstigere Generierung bei 5 oder 10 Sekunden. Den model-Parameter auf den gewünschten Versions-Slug setzen.
Nein. Wenn der custom:runapi-Provider bereits in Hermes Agent für Chat oder Bildgenerierung konfiguriert ist, funktionieren dieselbe base_url und derselbe API-Key für Kling-Video-Endpunkte. Einfach den Request-Pfad und den model-Parameter ändern.
Nein. RunAPI berechnet nur abgeschlossene Generierungen. Wenn der Task fehlschlägt oder upstream ein Timeout auftritt, werden die reservierten Credits auf das Kontoguthaben zurückgebucht.
Hermes Agent Grundeinrichtung
Noch nicht eingerichtet? Mit der RunAPI-Einrichtungsanleitung für Hermes Agent starten.
Hermes Agent Einrichtungsanleitung →Kling in Hermes Agent noch heute ausprobieren.
Einen kostenlosen RunAPI-Key holen, den custom:runapi-Provider konfigurieren und mit Kling 3.0 Videos generieren.