---
title: &quot;Usa Kling in OpenClaw tramite RunAPI — Guida API Video&quot;
url: &quot;https://runapi.ai/it/openclaw-kling.md&quot;
canonical: &quot;https://runapi.ai/it/openclaw-kling&quot;
locale: &quot;it&quot;
model: &quot;kling&quot;
---

# Usa Kling in OpenClaw.

Kling 3.0 di Kuaishou genera video da testo o immagini fino a 1080p con audio nativo, scene multi-shot e durate da 3 a 15 secondi. Gli agenti OpenClaw lo chiamano tramite RunAPI con la stessa API key usata per la chat — invia un prompt, esegui il polling del task e ricevi un URL video.

## API example

```bash
curl -X POST https://runapi.ai/api/v1/kling/text_to_video \
  -H &quot;Authorization: Bearer $RUNAPI_API_KEY&quot; \
  -H &quot;Content-Type: application/json&quot; \
  -d &#39;{
    &quot;model&quot;: &quot;kling-3.0&quot;,
    &quot;prompt&quot;: &quot;A drone shot pulling back from a mountain lake at sunrise, mist rising off the water, cinematic lighting&quot;,
    &quot;duration_seconds&quot;: 5,
    &quot;aspect_ratio&quot;: &quot;16:9&quot;,
    &quot;enable_sound&quot;: true,
    &quot;output_resolution&quot;: &quot;1080p&quot;
  }&#39;

```

### Response

```json
{
  &quot;task_id&quot;: &quot;tsk_abc123&quot;,
  &quot;status&quot;: &quot;pending&quot;,
  &quot;model&quot;: &quot;kling-3.0&quot;
}

```

## How it works

1. **Configura RunAPI** — Imposta la variabile d&#39;ambiente RUNAPI_API_KEY. Se hai già configurato RunAPI come provider OpenClaw per la chat, la stessa key funziona per la generazione video — nessuna configurazione aggiuntiva necessaria.
2. **Chiama Kling text_to_video** — Invia una richiesta POST a /api/v1/kling/text_to_video con model impostato su kling-3.0. Includi un prompt, duration_seconds (3–15), aspect_ratio e facoltativamente enable_sound per l&#39;audio nativo. Per la generazione guidata da immagine, usa /api/v1/kling/image_to_video con un first_frame_image_url.
3. **Ottieni il risultato** — L&#39;endpoint restituisce subito un task_id. Esegui il polling dell&#39;endpoint di stato del task finché lo stato non cambia in completed, poi recupera l&#39;URL video dalla risposta. La generazione richiede tipicamente 30–120 secondi in base alla durata e alla risoluzione.

## Parameters

| Parameter | Type | Description |
|-----------|------|-------------|
| `model` | `string` | Obbligatorio. kling-3.0 per la versione più recente. |
| `prompt` | `string` | Descrizione del video. Obbligatorio salvo se multi_shots è attivo. |
| `duration_seconds` | `integer` | Durata del video. Kling 3.0 supporta 3–15 secondi. Le versioni precedenti accettano 5 o 10. |
| `aspect_ratio` | `string` | Rapporto d&#39;aspetto dell&#39;output: 16:9, 9:16 o 1:1. |
| `output_resolution` | `string` | Risoluzione: 720p, 1080p o 4k. Risoluzioni più alte costano di più per secondo. |
| `enable_sound` | `boolean` | Genera audio nativo insieme al video. Aumenta il costo al secondo. |
| `negative_prompt` | `string` | Elementi da escludere dalla generazione. |
| `first_frame_image_url` | `string` | URL dell&#39;immagine da usare come primo fotogramma (modalità single-shot). |
| `cfg_scale` | `number` | Scala di guida (0–1). Valori più alti seguono il prompt più fedelmente. |
| `multi_shots` | `boolean` | Abilita la generazione di scene multi-shot con prompt separati per segmento. |

## FAQ

### Come funziona la fatturazione al secondo di Kling su RunAPI?

Kling addebita per secondo di video generato. La tariffa dipende da output_resolution e se enable_sound è attivo. Un clip da 5 secondi a 720p senza audio è l&#39;opzione più economica; 1080p con audio costa circa il doppio per secondo. Controlla la pagina dei prezzi di RunAPI per le tariffe esatte.

### Qual è la differenza tra text_to_video e image_to_video?

text_to_video genera un clip da un solo prompt testuale. image_to_video richiede un first_frame_image_url e anima a partire da quell&#39;immagine. Entrambi gli endpoint restituiscono un task_id asincrono e supportano le stesse opzioni di durata e risoluzione.

### Kling può generare video con audio?

Sì. Imposta enable_sound su true nel corpo della richiesta. Kling 3.0 genera audio sincronizzato che corrisponde al contenuto video. La generazione audio aumenta il costo al secondo — a 720p, l&#39;audio aggiunge circa 3 centesimi per secondo.

### Qual è la durata massima del video supportata da Kling 3.0?

Kling 3.0 supporta da 3 a 15 secondi tramite il parametro duration_seconds. Le versioni precedenti come kling-v2.5-turbo-text-to-video-pro accettano solo 5 o 10 secondi.

### Posso controllare il movimento della telecamera nei video Kling?

Kling 3.0 ha un endpoint motion_control separato su /api/v1/kling/motion_control per applicare preset di movimento a un&#39;immagine sorgente con un video di riferimento. L&#39;endpoint text_to_video si basa sulle descrizioni nel prompt per la direzione della telecamera.


## Links

- [Guida di configurazione di OpenClaw →](https://runapi.ai/it/openclaw)
- [Modelli Kling →](https://runapi.ai/it/models/kling)
- [Model catalog](https://runapi.ai/it/models)
- [API docs](https://runapi.ai/it/docs)