Kling in OpenClaw verwenden.
Kling 3.0 von Kuaishou generiert Videos aus Text oder Bildern mit bis zu 1080p, nativem Audio, Multi-Shot-Szenen und 3–15 Sekunden Dauer. OpenClaw-Agenten rufen es über RunAPI mit demselben API-Key wie für Chat auf — Prompt senden, Task abfragen, Video-URL empfangen.
RunAPI verwenden, um ein Video mit Kling 3.0 zu generieren.
Requirements:
- Call POST https://runapi.ai/api/v1/kling/text_to_video
- Set model to "kling-3.0"
- Read the API key from RUNAPI_API_KEY environment variable
- Set duration_seconds to control length (3–15 seconds)
- Set aspect_ratio to "16:9" for landscape video
- Enable sound with enable_sound: true for native audio
- The response is async — poll the task status endpoint until the task completes, then retrieve the video URL
curl -X POST https://runapi.ai/api/v1/kling/text_to_video \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "kling-3.0",
"prompt": "A drone shot pulling back from a mountain lake at sunrise, mist rising off the water, cinematic lighting",
"duration_seconds": 5,
"aspect_ratio": "16:9",
"enable_sound": true,
"output_resolution": "1080p"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "kling-3.0"
}
Kling in OpenClaw in drei Schritten verwenden
RunAPI konfigurieren
Die RUNAPI_API_KEY-Umgebungsvariable setzen. Wenn RunAPI bereits als OpenClaw-Provider für Chat konfiguriert ist, funktioniert derselbe Key für die Videogenerierung — keine zusätzliche Einrichtung nötig.
export RUNAPI_API_KEY=runapi_xxx
Kling text_to_video aufrufen
Einen POST-Request an /api/v1/kling/text_to_video mit model kling-3.0 senden. Einen Prompt, duration_seconds (3–15), aspect_ratio und optional enable_sound für nativen Audio angeben. Für bildgesteuerte Generierung /api/v1/kling/image_to_video mit first_frame_image_url verwenden.
POST /api/v1/kling/text_to_video
Ergebnis abrufen
Der Endpunkt gibt sofort eine task_id zurück. Den Task-Status-Endpunkt abfragen, bis der Status auf completed wechselt, dann die Video-URL aus der Antwort abrufen. Die Generierung dauert typischerweise 30–120 Sekunden je nach Dauer und Auflösung.
GET /api/v1/kling/text_to_video/tsk_abc123
Kling text_to_video API-Parameter
| Parameter | Typ | Beschreibung |
|---|---|---|
model |
string |
Erforderlich. kling-3.0 für die neueste Version. |
prompt |
string |
Videobeschreibung. Erforderlich, außer multi_shots ist aktiviert. |
duration_seconds |
integer |
Videolänge. Kling 3.0 unterstützt 3–15 Sekunden. Ältere Versionen akzeptieren 5 oder 10. |
aspect_ratio |
string |
Ausgabe-Seitenverhältnis: 16:9, 9:16 oder 1:1. |
output_resolution |
string |
Auflösung: 720p, 1080p oder 4k. Höhere Auflösung kostet mehr pro Sekunde. |
enable_sound |
boolean |
Nativen Audio neben dem Video generieren. Erhöht die Kosten pro Sekunde. |
negative_prompt |
string |
Elemente, die von der Generierung ausgeschlossen werden sollen. |
first_frame_image_url |
string |
Bild-URL als Eröffnungsframe (Einzelaufnahme-Modus). |
cfg_scale |
number |
Guidance-Skala (0–1). Höhere Werte folgen dem Prompt enger. |
multi_shots |
boolean |
Multi-Shot-Szenegenerierung mit separaten Prompts pro Segment aktivieren. |
Was ist Kling auf OpenClaw?
Kling 3.0 von Kuaishou ist bekannt für kinematische Videoqualität mit starker Tuchsimulation, Fluiddynamik und Bewegungsphysik. Es generiert Clips bis zu 3 Minuten Länge aus Text oder Bildern bei bis zu 1080p mit nativem Audio und Mehrfach-Shot-Szenen. OpenClaw-Agenten rufen es über den RunAPI-Endpunkt mit demselben API-Key auf, der für Chat verwendet wird.
Kling Anwendungsfälle
B-Roll und Establishing Shots
Szenenlange B-Roll-Aufnahmen für enge Fristen generieren – Naturaufnahmen, Reise-Content und Umgebungsaufnahmen, bei denen Klings Bewegungsphysik und kinematische Beleuchtung herausstechen.
Produkt-Lifestyle-Content
Produktvideos für Food-, Mode- oder Lifestyle-Marken aus einem einzelnen Bild oder Textprompt erstellen, mit natürlicher Kamerabewegung und realistischem Materialrendering.
Social-Media-Shorts
Kurze Clips für TikTok, Reels oder YouTube Shorts mit kinematischem Framing produzieren. duration_seconds auf 5 oder 10 für plattformgerechte Längen setzen.
Kling + OpenClaw — Fragen
Kling berechnet pro Sekunde generiertes Video. Der Preis hängt von output_resolution und enable_sound ab. Ein 5-Sekunden-720p-Clip ohne Sound ist die günstigste Option; 1080p mit Sound kostet ungefähr doppelt so viel pro Sekunde. Aktuelle Preise auf der RunAPI-Preisseite.
text_to_video generiert einen Clip allein aus einem Textprompt. image_to_video benötigt eine first_frame_image_url und animiert ab diesem Bild. Beide Endpunkte geben eine asynchrone task_id zurück und unterstützen dieselben Dauer- und Auflösungsoptionen.
Ja. enable_sound im Request-Body auf true setzen. Kling 3.0 generiert synchronisierten Audio passend zum Videoinhalt. Die Soundgenerierung erhöht die Kosten pro Sekunde — bei 720p kommen etwa 3 Cent pro Sekunde hinzu.
Kling 3.0 unterstützt 3 bis 15 Sekunden über den duration_seconds-Parameter. Ältere Versionen wie kling-v2.5-turbo-text-to-video-pro akzeptieren nur 5 oder 10 Sekunden.
Kling 3.0 hat einen separaten motion_control-Endpunkt unter /api/v1/kling/motion_control, um Bewegungsvoreinstellungen auf ein Quellbild mit einem Referenzvideo anzuwenden. Der text_to_video-Endpunkt verlässt sich auf Promptbeschreibungen für die Kamerarichtung.
OpenClaw Grundeinrichtung
Noch nicht eingerichtet? Mit der RunAPI-Einrichtungsanleitung für OpenClaw starten.
OpenClaw Einrichtungsanleitung →Kling in OpenClaw noch heute ausprobieren.
Einen kostenlosen RunAPI-Key holen, den Prompt in OpenClaw einfügen und mit Kling 3.0 Videos generieren.