Używaj Kling w Hermes Agent.
Kling 3.0 od Kuaishou generuje wideo z tekstu lub obrazów w rozdzielczości do 1080p z natywnym audio, scenami wieloujęciowymi i czasem trwania od 3 do 15 sekund. Hermes Agent wywołuje go przez RunAPI za pomocą providera custom:runapi — ten sam klucz i base URL skonfigurowane do czatu.
Użyj RunAPI do wygenerowania wideo z Kling 3.0 przez Hermes Agent.
Wymagania:
- Użyj providera custom:runapi już skonfigurowanego w Hermes Agent
- Wywołaj POST https://runapi.ai/api/v1/kling/text_to_video
- Ustaw model na "kling-3.0"
- Zmienna środowiskowa RUNAPI_API_KEY zapewnia autoryzację
- Ustaw duration_seconds, aby kontrolować długość (3–15 sekund)
- Ustaw aspect_ratio na "16:9" dla wideo poziomego
- Włącz dźwięk z enable_sound: true dla natywnego audio
- Odpowiedź jest asynchroniczna — odpytuj endpoint statusu zadania, aż zadanie zostanie ukończone, a następnie pobierz URL wideo
curl -X POST https://runapi.ai/api/v1/kling/text_to_video \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "kling-3.0",
"prompt": "A drone shot pulling back from a mountain lake at sunrise, mist rising off the water, cinematic lighting",
"duration_seconds": 5,
"aspect_ratio": "16:9",
"enable_sound": true,
"output_resolution": "1080p"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "kling-3.0"
}
Używaj Kling w Hermes Agent w trzech krokach
Skonfiguruj RunAPI
Ustaw zmienną środowiskową RUNAPI_API_KEY. Jeśli dodałeś już RunAPI jako provider custom:runapi w Hermes Agent do czatu, ten sam klucz i base_url działają do generowania wideo — nie jest potrzebna dodatkowa konfiguracja.
export RUNAPI_API_KEY=runapi_xxx
Wywołaj Kling text_to_video
Wyślij POST na /api/v1/kling/text_to_video z modelem ustawionym na kling-3.0. Dołącz prompt, duration_seconds (3–15), aspect_ratio i opcjonalnie enable_sound dla natywnego audio. Do generowania opartego na obrazie użyj /api/v1/kling/image_to_video z first_frame_image_url.
POST /api/v1/kling/text_to_video
Pobierz wynik
Endpoint natychmiast zwraca task_id. Odpytuj endpoint statusu zadania, aż status zmieni się na completed, a następnie pobierz URL wideo z odpowiedzi. Generowanie zazwyczaj zajmuje 30–120 sekund w zależności od czasu trwania i rozdzielczości.
GET /api/v1/kling/text_to_video/tsk_abc123
Parametry API Kling text_to_video
| Parametr | Typ | Opis |
|---|---|---|
model |
string |
Wymagane. kling-3.0 dla najnowszej wersji. |
prompt |
string |
Opis wideo. Wymagane, chyba że multi_shots jest włączone. |
duration_seconds |
integer |
Długość wideo. Kling 3.0 obsługuje 3–15 sekund. Starsze wersje akceptują 5 lub 10. |
aspect_ratio |
string |
Proporcje wyjściowe: 16:9, 9:16 lub 1:1. |
output_resolution |
string |
Rozdzielczość: 720p, 1080p lub 4k. Wyższa rozdzielczość kosztuje więcej za sekundę. |
enable_sound |
boolean |
Generuj natywne audio wraz z wideo. Zwiększa koszt per sekundę. |
negative_prompt |
string |
Elementy do wykluczenia z generowania. |
first_frame_image_url |
string |
URL obrazu używanego jako klatka otwierająca (tryb jednoujęciowy). |
cfg_scale |
number |
Skala prowadzenia (0–1). Wyższe wartości bardziej ściśle podążają za promptem. |
multi_shots |
boolean |
Włącz generowanie scen wieloujęciowych z osobnymi promptami dla każdego segmentu. |
Czym jest Kling w Hermes Agent?
Kling 3.0 firmy Kuaishou dostarcza kinematograficzne klipy ze spójnością postaci i silną fizyką ruchu — draperią tkanin, dynamiką płynów i realistycznym ruchem kamery. Przez provider custom:runapi Hermes Agent uzyskujesz tekst-do-wideo i obraz-do-wideo w rozdzielczości do 1080p z natywnym dźwiękiem.
Zastosowania Kling
Dłuższe treści narracyjne
Używaj trybu wieloujęciowego Kling do tworzenia materiałów długości sceny do 3 minut ze spójnością postaci.
Treści podróżnicze i przyrodnicze
Generuj B-roll do vloga podróżniczego i materiały przyrodnicze z realistycznym oświetleniem i ruchem.
Filmy demonstracyjne produktów
Animuj zdjęcie produktu w krótkie wideo z ruchem kamery i dynamicznym oświetleniem.
Pytania o Kling + Hermes Agent
Kling rozlicza się za każdą sekundę wygenerowanego wideo. Stawka zależy od output_resolution i tego, czy enable_sound jest włączone. Klip 5-sekundowy w 720p bez dźwięku jest najtańszą opcją; 1080p z dźwiękiem kosztuje mniej więcej dwa razy tyle za sekundę. Sprawdź stronę cenową RunAPI po dokładne stawki.
text_to_video generuje klip wyłącznie z promptu tekstowego. image_to_video wymaga first_frame_image_url i animuje wychodzące z tego obrazu. Oba endpointy zwracają asynchroniczne task_id i obsługują te same opcje czasu trwania i rozdzielczości.
Tak. RunAPI oferuje również kling-v2.5-turbo-text-to-video-pro i kling-v2.5-turbo-image-to-video-pro do szybszego, tańszego generowania przy 5 lub 10 sekundach. Ustaw parametr model na slug wybranej wersji.
Nie. Jeśli skonfigurowałeś już provider custom:runapi w Hermes Agent do czatu lub generowania obrazów, ten sam base_url i klucz API działają dla endpointów wideo Kling. Wystarczy zmienić ścieżkę żądania i parametr model.
Nie. RunAPI rozlicza tylko ukończone generowania. Jeśli zadanie nie powiedzie się lub przekroczy limit czasu po stronie upstream, zarezerwowane kredyty są zwracane na saldo konta.
Ogólna konfiguracja Hermes Agent
Nie skonfigurowano jeszcze? Zacznij od przewodnika konfiguracji RunAPI dla Hermes Agent.
Przewodnik konfiguracji Hermes Agent →Wypróbuj Kling w Hermes Agent już dziś.
Zdobądź darmowy klucz RunAPI, skonfiguruj provider custom:runapi i zacznij generować wideo z Kling 3.0.