Jak działa rozliczenie per sekunda Kling na RunAPI?

Kling rozlicza się za każdą sekundę wygenerowanego wideo. Stawka zależy od output_resolution i tego, czy enable_sound jest włączone. Klip 5-sekundowy w 720p bez dźwięku jest najtańszą opcją; 1080p z dźwiękiem kosztuje mniej więcej dwa razy tyle za sekundę. Sprawdź stronę cenową RunAPI po dokładne stawki.

Jaka jest różnica między text_to_video a image_to_video?

text_to_video generuje klip wyłącznie z promptu tekstowego. image_to_video wymaga first_frame_image_url i animuje wychodzące z tego obrazu. Oba endpointy zwracają asynchroniczne task_id i obsługują te same opcje czasu trwania i rozdzielczości.

Czy Kling może generować wideo z dźwiękiem?

Tak. Ustaw enable_sound na true w treści żądania. Kling 3.0 generuje zsynchronizowany dźwięk dopasowany do treści wideo. Generowanie dźwięku zwiększa koszt per sekundę — przy 720p dźwięk dodaje około 3 centów za sekundę.

Jaki jest maksymalny czas trwania wideo obsługiwany przez Kling 3.0?

Kling 3.0 obsługuje od 3 do 15 sekund za pomocą parametru duration_seconds. Starsze wersje, takie jak kling-v2.5-turbo-text-to-video-pro, akceptują tylko 5 lub 10 sekund.

Czy mogę kontrolować ruch kamery w wideo Kling?

Kling 3.0 posiada oddzielny endpoint motion_control pod adresem /api/v1/kling/motion_control do stosowania presetów ruchu do obrazu źródłowego z referencyjnym wideo. Endpoint text_to_video polega na opisach promptu dla kierunku kamery.

OPENCLAW + KLING

Używaj Kling w OpenClaw.

Kling 3.0 od Kuaishou generuje wideo z tekstu lub obrazów w rozdzielczości do 1080p z natywnym audio, scenami wieloujęciowymi i czasem trwania od 3 do 15 sekund. Agenci OpenClaw wywołują go przez RunAPI tym samym kluczem API używanym do czatu — wyślij prompt, odpytaj zadanie i odbierz URL wideo.

Pobierz API Key Przeczytaj dokumentację

jeden klucz API · endpoint text to video + image to video · rozliczenie per sekunda

Użyj RunAPI do wygenerowania wideo z Kling 3.0.


  Wymagania:

  - Wywołaj POST https://runapi.ai/api/v1/kling/text_to_video

  - Ustaw model na "kling-3.0"

  - Odczytaj klucz API ze zmiennej środowiskowej RUNAPI_API_KEY

  - Ustaw duration_seconds, aby kontrolować długość (3–15 sekund)

  - Ustaw aspect_ratio na "16:9" dla wideo poziomego

  - Włącz dźwięk z enable_sound: true dla natywnego audio

  - Odpowiedź jest asynchroniczna — odpytuj endpoint statusu zadania, aż zadanie zostanie ukończone, a następnie pobierz URL wideo

curl -X POST https://runapi.ai/api/v1/kling/text_to_video \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kling-3.0",
    "prompt": "A drone shot pulling back from a mountain lake at sunrise, mist rising off the water, cinematic lighting",
    "duration_seconds": 5,
    "aspect_ratio": "16:9",
    "enable_sound": true,
    "output_resolution": "1080p"
  }'

{
  "task_id": "tsk_abc123",
  "status": "pending",
  "model": "kling-3.0"
}

Skopiuj polecenie curl do testowania kling

JAK TO DZIAŁA

Używaj Kling w OpenClaw w trzech krokach

Skonfiguruj RunAPI

Ustaw zmienną środowiskową RUNAPI_API_KEY. Jeśli skonfigurowałeś już RunAPI jako provider OpenClaw do czatu, ten sam klucz działa do generowania wideo — nie jest potrzebna dodatkowa konfiguracja.

export RUNAPI_API_KEY=runapi_xxx

Wywołaj Kling text_to_video

Wyślij POST na /api/v1/kling/text_to_video z modelem ustawionym na kling-3.0. Dołącz prompt, duration_seconds (3–15), aspect_ratio i opcjonalnie enable_sound dla natywnego audio. Do generowania opartego na obrazie użyj /api/v1/kling/image_to_video z first_frame_image_url.

POST /api/v1/kling/text_to_video

Pobierz wynik

Endpoint natychmiast zwraca task_id. Odpytuj endpoint statusu zadania, aż status zmieni się na completed, a następnie pobierz URL wideo z odpowiedzi. Generowanie zazwyczaj zajmuje 30–120 sekund w zależności od czasu trwania i rozdzielczości.

GET /api/v1/kling/text_to_video/tsk_abc123

PARAMETRY

Parametry API Kling text_to_video

Parametr	Typ	Opis
`model`	`string`	Wymagane. kling-3.0 dla najnowszej wersji.
`prompt`	`string`	Opis wideo. Wymagane, chyba że multi_shots jest włączone.
`duration_seconds`	`integer`	Długość wideo. Kling 3.0 obsługuje 3–15 sekund. Starsze wersje akceptują 5 lub 10.
`aspect_ratio`	`string`	Proporcje wyjściowe: 16:9, 9:16 lub 1:1.
`output_resolution`	`string`	Rozdzielczość: 720p, 1080p lub 4k. Wyższa rozdzielczość kosztuje więcej za sekundę.
`enable_sound`	`boolean`	Generuj natywne audio wraz z wideo. Zwiększa koszt per sekundę.
`negative_prompt`	`string`	Elementy do wykluczenia z generowania.
`first_frame_image_url`	`string`	URL obrazu używanego jako klatka otwierająca (tryb jednoujęciowy).
`cfg_scale`	`number`	Skala prowadzenia (0–1). Wyższe wartości bardziej ściśle podążają za promptem.
`multi_shots`	`boolean`	Włącz generowanie scen wieloujęciowych z osobnymi promptami dla każdego segmentu.

Czym jest Kling w OpenClaw?

Kling 3.0 firmy Kuaishou słynie z kinematograficznej jakości wideo z silną symulacją tkanin, dynamiką płynów i fizyką ruchu. Generuje klipy do 3 minut z tekstu lub obrazów w rozdzielczości do 1080p z natywnym dźwiękiem i scenami wieloujęciowymi. Agenty OpenClaw wywołują go przez endpoint RunAPI z tym samym kluczem API co do czatu.

Zastosowania Kling

B-roll i ujęcia wprowadzające

Generuj materiał B-roll długości sceny dla napiętych terminów bez ekipy filmowej ani lokacji.

Treści lifestyle dla produktów

Twórz filmy produktowe dla marek spożywczych, modowych lub lifestyle'owych z realistycznym zachowaniem ruchu.

Krótkie klipy do mediów społecznościowych

Produkuj krótkie klipy dla TikToka, Reels lub YouTube Shorts w rozdzielczości do 1080p.

FAQ

Pytania o Kling + OpenClaw

Ogólna konfiguracja OpenClaw

Nie skonfigurowano jeszcze? Zacznij od przewodnika konfiguracji RunAPI dla OpenClaw.

Przewodnik konfiguracji OpenClaw →

Katalog modeli Kling

Zobacz wszystkie warianty Kling, ceny i dokumentację API.

Modele Kling →

Wypróbuj Kling w OpenClaw już dziś.

Zdobądź darmowy klucz RunAPI, wklej prompt do OpenClaw i zacznij generować wideo z Kling 3.0.

Przeglądaj modele →