Usa Kling in OpenClaw.
Kling 3.0 di Kuaishou genera video da testo o immagini fino a 1080p con audio nativo, scene multi-shot e durate da 3 a 15 secondi. Gli agenti OpenClaw lo chiamano tramite RunAPI con la stessa API key usata per la chat — invia un prompt, esegui il polling del task e ricevi un URL video.
Usa RunAPI per generare un video con Kling 3.0.
Requisiti:
- Chiama POST https://runapi.ai/api/v1/kling/text_to_video
- Imposta model su "kling-3.0"
- Leggi la API key dalla variabile d'ambiente RUNAPI_API_KEY
- Imposta duration_seconds per controllare la durata (3–15 secondi)
- Imposta aspect_ratio su "16:9" per video orizzontale
- Abilita l'audio con enable_sound: true per l'audio nativo
- La risposta è asincrona — esegui il polling dell'endpoint di stato del task finché il task non è completato, poi recupera l'URL video
curl -X POST https://runapi.ai/api/v1/kling/text_to_video \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "kling-3.0",
"prompt": "A drone shot pulling back from a mountain lake at sunrise, mist rising off the water, cinematic lighting",
"duration_seconds": 5,
"aspect_ratio": "16:9",
"enable_sound": true,
"output_resolution": "1080p"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "kling-3.0"
}
Usa Kling in OpenClaw in tre passaggi
Configura RunAPI
Imposta la variabile d'ambiente RUNAPI_API_KEY. Se hai già configurato RunAPI come provider OpenClaw per la chat, la stessa key funziona per la generazione video — nessuna configurazione aggiuntiva necessaria.
export RUNAPI_API_KEY=runapi_xxx
Chiama Kling text_to_video
Invia una richiesta POST a /api/v1/kling/text_to_video con model impostato su kling-3.0. Includi un prompt, duration_seconds (3–15), aspect_ratio e facoltativamente enable_sound per l'audio nativo. Per la generazione guidata da immagine, usa /api/v1/kling/image_to_video con un first_frame_image_url.
POST /api/v1/kling/text_to_video
Ottieni il risultato
L'endpoint restituisce subito un task_id. Esegui il polling dell'endpoint di stato del task finché lo stato non cambia in completed, poi recupera l'URL video dalla risposta. La generazione richiede tipicamente 30–120 secondi in base alla durata e alla risoluzione.
GET /api/v1/kling/text_to_video/tsk_abc123
Parametri API Kling text_to_video
| Parametro | Tipo | Descrizione |
|---|---|---|
model |
string |
Obbligatorio. kling-3.0 per la versione più recente. |
prompt |
string |
Descrizione del video. Obbligatorio salvo se multi_shots è attivo. |
duration_seconds |
integer |
Durata del video. Kling 3.0 supporta 3–15 secondi. Le versioni precedenti accettano 5 o 10. |
aspect_ratio |
string |
Rapporto d'aspetto dell'output: 16:9, 9:16 o 1:1. |
output_resolution |
string |
Risoluzione: 720p, 1080p o 4k. Risoluzioni più alte costano di più per secondo. |
enable_sound |
boolean |
Genera audio nativo insieme al video. Aumenta il costo al secondo. |
negative_prompt |
string |
Elementi da escludere dalla generazione. |
first_frame_image_url |
string |
URL dell'immagine da usare come primo fotogramma (modalità single-shot). |
cfg_scale |
number |
Scala di guida (0–1). Valori più alti seguono il prompt più fedelmente. |
multi_shots |
boolean |
Abilita la generazione di scene multi-shot con prompt separati per segmento. |
Cos'è Kling su OpenClaw?
Kling 3.0 di Kuaishou è noto per la qualità video cinematografica con forte simulazione del tessuto, dinamica dei fluidi e fisica del movimento. Genera clip fino a 3 minuti di lunghezza da testo o immagini fino a 1080p con audio nativo e scene multi-shot. Gli agenti OpenClaw lo chiamano tramite l'endpoint RunAPI con la stessa API key usata per la chat.
Casi d'uso di Kling
Riprese B-roll e di stabilimento
Generare filmati B-roll della lunghezza di una scena per scadenze ravvicinate -- riprese di natura, contenuto di viaggio e filmati di ambiente dove la fisica del movimento e l'illuminazione cinematografica di Kling si distinguono.
Contenuto lifestyle del prodotto
Creare video di prodotti per marchi alimentari, di moda o lifestyle da una singola immagine o prompt testuale, con movimento naturale della camera e rendering realistico dei materiali.
Short per i social media
Produrre brevi clip per TikTok, Reels o YouTube Shorts con inquadratura cinematografica. Impostare duration_seconds a 5 o 10 per durate pronte per la piattaforma.
Domande su Kling + OpenClaw
Kling addebita per secondo di video generato. La tariffa dipende da output_resolution e se enable_sound è attivo. Un clip da 5 secondi a 720p senza audio è l'opzione più economica; 1080p con audio costa circa il doppio per secondo. Controlla la pagina dei prezzi di RunAPI per le tariffe esatte.
text_to_video genera un clip da un solo prompt testuale. image_to_video richiede un first_frame_image_url e anima a partire da quell'immagine. Entrambi gli endpoint restituiscono un task_id asincrono e supportano le stesse opzioni di durata e risoluzione.
Sì. Imposta enable_sound su true nel corpo della richiesta. Kling 3.0 genera audio sincronizzato che corrisponde al contenuto video. La generazione audio aumenta il costo al secondo — a 720p, l'audio aggiunge circa 3 centesimi per secondo.
Kling 3.0 supporta da 3 a 15 secondi tramite il parametro duration_seconds. Le versioni precedenti come kling-v2.5-turbo-text-to-video-pro accettano solo 5 o 10 secondi.
Kling 3.0 ha un endpoint motion_control separato su /api/v1/kling/motion_control per applicare preset di movimento a un'immagine sorgente con un video di riferimento. L'endpoint text_to_video si basa sulle descrizioni nel prompt per la direzione della telecamera.
Configurazione generale di OpenClaw
Non ancora configurato? Inizia con la guida di configurazione RunAPI per OpenClaw.
Guida di configurazione di OpenClaw →Catalogo modelli Kling
Vedi tutte le varianti Kling, i prezzi e la documentazione API.
Modelli Kling →Prova Kling in OpenClaw oggi.
Ottieni una API key RunAPI gratuita, incolla il prompt in OpenClaw e inizia a generare video con Kling 3.0.