Używaj Kling w OpenClaw.
Kling 3.0 od Kuaishou generuje wideo z tekstu lub obrazów w rozdzielczości do 1080p z natywnym audio, scenami wieloujęciowymi i czasem trwania od 3 do 15 sekund. Agenci OpenClaw wywołują go przez RunAPI tym samym kluczem API używanym do czatu — wyślij prompt, odpytaj zadanie i odbierz URL wideo.
Użyj RunAPI do wygenerowania wideo z Kling 3.0.
Wymagania:
- Wywołaj POST https://runapi.ai/api/v1/kling/text_to_video
- Ustaw model na "kling-3.0"
- Odczytaj klucz API ze zmiennej środowiskowej RUNAPI_API_KEY
- Ustaw duration_seconds, aby kontrolować długość (3–15 sekund)
- Ustaw aspect_ratio na "16:9" dla wideo poziomego
- Włącz dźwięk z enable_sound: true dla natywnego audio
- Odpowiedź jest asynchroniczna — odpytuj endpoint statusu zadania, aż zadanie zostanie ukończone, a następnie pobierz URL wideo
curl -X POST https://runapi.ai/api/v1/kling/text_to_video \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "kling-3.0",
"prompt": "A drone shot pulling back from a mountain lake at sunrise, mist rising off the water, cinematic lighting",
"duration_seconds": 5,
"aspect_ratio": "16:9",
"enable_sound": true,
"output_resolution": "1080p"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "kling-3.0"
}
Używaj Kling w OpenClaw w trzech krokach
Skonfiguruj RunAPI
Ustaw zmienną środowiskową RUNAPI_API_KEY. Jeśli skonfigurowałeś już RunAPI jako provider OpenClaw do czatu, ten sam klucz działa do generowania wideo — nie jest potrzebna dodatkowa konfiguracja.
export RUNAPI_API_KEY=runapi_xxx
Wywołaj Kling text_to_video
Wyślij POST na /api/v1/kling/text_to_video z modelem ustawionym na kling-3.0. Dołącz prompt, duration_seconds (3–15), aspect_ratio i opcjonalnie enable_sound dla natywnego audio. Do generowania opartego na obrazie użyj /api/v1/kling/image_to_video z first_frame_image_url.
POST /api/v1/kling/text_to_video
Pobierz wynik
Endpoint natychmiast zwraca task_id. Odpytuj endpoint statusu zadania, aż status zmieni się na completed, a następnie pobierz URL wideo z odpowiedzi. Generowanie zazwyczaj zajmuje 30–120 sekund w zależności od czasu trwania i rozdzielczości.
GET /api/v1/kling/text_to_video/tsk_abc123
Parametry API Kling text_to_video
| Parametr | Typ | Opis |
|---|---|---|
model |
string |
Wymagane. kling-3.0 dla najnowszej wersji. |
prompt |
string |
Opis wideo. Wymagane, chyba że multi_shots jest włączone. |
duration_seconds |
integer |
Długość wideo. Kling 3.0 obsługuje 3–15 sekund. Starsze wersje akceptują 5 lub 10. |
aspect_ratio |
string |
Proporcje wyjściowe: 16:9, 9:16 lub 1:1. |
output_resolution |
string |
Rozdzielczość: 720p, 1080p lub 4k. Wyższa rozdzielczość kosztuje więcej za sekundę. |
enable_sound |
boolean |
Generuj natywne audio wraz z wideo. Zwiększa koszt per sekundę. |
negative_prompt |
string |
Elementy do wykluczenia z generowania. |
first_frame_image_url |
string |
URL obrazu używanego jako klatka otwierająca (tryb jednoujęciowy). |
cfg_scale |
number |
Skala prowadzenia (0–1). Wyższe wartości bardziej ściśle podążają za promptem. |
multi_shots |
boolean |
Włącz generowanie scen wieloujęciowych z osobnymi promptami dla każdego segmentu. |
Czym jest Kling w OpenClaw?
Kling 3.0 firmy Kuaishou słynie z kinematograficznej jakości wideo z silną symulacją tkanin, dynamiką płynów i fizyką ruchu. Generuje klipy do 3 minut z tekstu lub obrazów w rozdzielczości do 1080p z natywnym dźwiękiem i scenami wieloujęciowymi. Agenty OpenClaw wywołują go przez endpoint RunAPI z tym samym kluczem API co do czatu.
Zastosowania Kling
B-roll i ujęcia wprowadzające
Generuj materiał B-roll długości sceny dla napiętych terminów bez ekipy filmowej ani lokacji.
Treści lifestyle dla produktów
Twórz filmy produktowe dla marek spożywczych, modowych lub lifestyle'owych z realistycznym zachowaniem ruchu.
Krótkie klipy do mediów społecznościowych
Produkuj krótkie klipy dla TikToka, Reels lub YouTube Shorts w rozdzielczości do 1080p.
Pytania o Kling + OpenClaw
Kling rozlicza się za każdą sekundę wygenerowanego wideo. Stawka zależy od output_resolution i tego, czy enable_sound jest włączone. Klip 5-sekundowy w 720p bez dźwięku jest najtańszą opcją; 1080p z dźwiękiem kosztuje mniej więcej dwa razy tyle za sekundę. Sprawdź stronę cenową RunAPI po dokładne stawki.
text_to_video generuje klip wyłącznie z promptu tekstowego. image_to_video wymaga first_frame_image_url i animuje wychodzące z tego obrazu. Oba endpointy zwracają asynchroniczne task_id i obsługują te same opcje czasu trwania i rozdzielczości.
Tak. Ustaw enable_sound na true w treści żądania. Kling 3.0 generuje zsynchronizowany dźwięk dopasowany do treści wideo. Generowanie dźwięku zwiększa koszt per sekundę — przy 720p dźwięk dodaje około 3 centów za sekundę.
Kling 3.0 obsługuje od 3 do 15 sekund za pomocą parametru duration_seconds. Starsze wersje, takie jak kling-v2.5-turbo-text-to-video-pro, akceptują tylko 5 lub 10 sekund.
Kling 3.0 posiada oddzielny endpoint motion_control pod adresem /api/v1/kling/motion_control do stosowania presetów ruchu do obrazu źródłowego z referencyjnym wideo. Endpoint text_to_video polega na opisach promptu dla kierunku kamery.
Ogólna konfiguracja OpenClaw
Nie skonfigurowano jeszcze? Zacznij od przewodnika konfiguracji RunAPI dla OpenClaw.
Przewodnik konfiguracji OpenClaw →Wypróbuj Kling w OpenClaw już dziś.
Zdobądź darmowy klucz RunAPI, wklej prompt do OpenClaw i zacznij generować wideo z Kling 3.0.