---
title: &quot;Kling in OpenClaw via RunAPI verwenden — Video-API-Anleitung&quot;
url: &quot;https://runapi.ai/de/openclaw-kling.md&quot;
canonical: &quot;https://runapi.ai/de/openclaw-kling&quot;
locale: &quot;de&quot;
model: &quot;kling&quot;
---

# Kling in OpenClaw verwenden.

Kling 3.0 von Kuaishou generiert Videos aus Text oder Bildern mit bis zu 1080p, nativem Audio, Multi-Shot-Szenen und 3–15 Sekunden Dauer. OpenClaw-Agenten rufen es über RunAPI mit demselben API-Key wie für Chat auf — Prompt senden, Task abfragen, Video-URL empfangen.

## API example

```bash
curl -X POST https://runapi.ai/api/v1/kling/text_to_video \
  -H &quot;Authorization: Bearer $RUNAPI_API_KEY&quot; \
  -H &quot;Content-Type: application/json&quot; \
  -d &#39;{
    &quot;model&quot;: &quot;kling-3.0&quot;,
    &quot;prompt&quot;: &quot;A drone shot pulling back from a mountain lake at sunrise, mist rising off the water, cinematic lighting&quot;,
    &quot;duration_seconds&quot;: 5,
    &quot;aspect_ratio&quot;: &quot;16:9&quot;,
    &quot;enable_sound&quot;: true,
    &quot;output_resolution&quot;: &quot;1080p&quot;
  }&#39;

```

### Response

```json
{
  &quot;task_id&quot;: &quot;tsk_abc123&quot;,
  &quot;status&quot;: &quot;pending&quot;,
  &quot;model&quot;: &quot;kling-3.0&quot;
}

```

## How it works

1. **RunAPI konfigurieren** — Die RUNAPI_API_KEY-Umgebungsvariable setzen. Wenn RunAPI bereits als OpenClaw-Provider für Chat konfiguriert ist, funktioniert derselbe Key für die Videogenerierung — keine zusätzliche Einrichtung nötig.
2. **Kling text_to_video aufrufen** — Einen POST-Request an /api/v1/kling/text_to_video mit model kling-3.0 senden. Einen Prompt, duration_seconds (3–15), aspect_ratio und optional enable_sound für nativen Audio angeben. Für bildgesteuerte Generierung /api/v1/kling/image_to_video mit first_frame_image_url verwenden.
3. **Ergebnis abrufen** — Der Endpunkt gibt sofort eine task_id zurück. Den Task-Status-Endpunkt abfragen, bis der Status auf completed wechselt, dann die Video-URL aus der Antwort abrufen. Die Generierung dauert typischerweise 30–120 Sekunden je nach Dauer und Auflösung.

## Parameters

| Parameter | Type | Description |
|-----------|------|-------------|
| `model` | `string` | Erforderlich. kling-3.0 für die neueste Version. |
| `prompt` | `string` | Videobeschreibung. Erforderlich, außer multi_shots ist aktiviert. |
| `duration_seconds` | `integer` | Videolänge. Kling 3.0 unterstützt 3–15 Sekunden. Ältere Versionen akzeptieren 5 oder 10. |
| `aspect_ratio` | `string` | Ausgabe-Seitenverhältnis: 16:9, 9:16 oder 1:1. |
| `output_resolution` | `string` | Auflösung: 720p, 1080p oder 4k. Höhere Auflösung kostet mehr pro Sekunde. |
| `enable_sound` | `boolean` | Nativen Audio neben dem Video generieren. Erhöht die Kosten pro Sekunde. |
| `negative_prompt` | `string` | Elemente, die von der Generierung ausgeschlossen werden sollen. |
| `first_frame_image_url` | `string` | Bild-URL als Eröffnungsframe (Einzelaufnahme-Modus). |
| `cfg_scale` | `number` | Guidance-Skala (0–1). Höhere Werte folgen dem Prompt enger. |
| `multi_shots` | `boolean` | Multi-Shot-Szenegenerierung mit separaten Prompts pro Segment aktivieren. |

## FAQ

### Wie funktioniert die sekundenbasierte Abrechnung von Kling auf RunAPI?

Kling berechnet pro Sekunde generiertes Video. Der Preis hängt von output_resolution und enable_sound ab. Ein 5-Sekunden-720p-Clip ohne Sound ist die günstigste Option; 1080p mit Sound kostet ungefähr doppelt so viel pro Sekunde. Aktuelle Preise auf der RunAPI-Preisseite.

### Was ist der Unterschied zwischen text_to_video und image_to_video?

text_to_video generiert einen Clip allein aus einem Textprompt. image_to_video benötigt eine first_frame_image_url und animiert ab diesem Bild. Beide Endpunkte geben eine asynchrone task_id zurück und unterstützen dieselben Dauer- und Auflösungsoptionen.

### Kann Kling Videos mit Sound generieren?

Ja. enable_sound im Request-Body auf true setzen. Kling 3.0 generiert synchronisierten Audio passend zum Videoinhalt. Die Soundgenerierung erhöht die Kosten pro Sekunde — bei 720p kommen etwa 3 Cent pro Sekunde hinzu.

### Was ist die maximale Videolänge, die Kling 3.0 unterstützt?

Kling 3.0 unterstützt 3 bis 15 Sekunden über den duration_seconds-Parameter. Ältere Versionen wie kling-v2.5-turbo-text-to-video-pro akzeptieren nur 5 oder 10 Sekunden.

### Kann ich die Kamerabewegung in Kling-Videos steuern?

Kling 3.0 hat einen separaten motion_control-Endpunkt unter /api/v1/kling/motion_control, um Bewegungsvoreinstellungen auf ein Quellbild mit einem Referenzvideo anzuwenden. Der text_to_video-Endpunkt verlässt sich auf Promptbeschreibungen für die Kamerarichtung.


## Links

- [OpenClaw Einrichtungsanleitung →](https://runapi.ai/de/openclaw)
- [Kling Modelle →](https://runapi.ai/de/models/kling)
- [Model catalog](https://runapi.ai/de/models)
- [API docs](https://runapi.ai/de/docs)
