---
title: &quot;OpenClaw에서 RunAPI로 Kling 사용하기 — 영상 API 가이드&quot;
url: &quot;https://runapi.ai/ko/openclaw-kling.md&quot;
canonical: &quot;https://runapi.ai/ko/openclaw-kling&quot;
locale: &quot;ko&quot;
model: &quot;kling&quot;
---

# OpenClaw에서 Kling을 사용하세요.

Kuaishou의 Kling 3.0은 텍스트 또는 이미지로부터 최대 1080p의 영상을 네이티브 오디오, 멀티샷 장면, 3~15초 길이로 생성합니다. OpenClaw 에이전트는 채팅에 사용하는 것과 동일한 API key로 RunAPI를 통해 호출합니다. 프롬프트를 보내고, 작업을 폴링하여 영상 URL을 받으세요.

## API example

```bash
curl -X POST https://runapi.ai/api/v1/kling/text_to_video \
  -H &quot;Authorization: Bearer $RUNAPI_API_KEY&quot; \
  -H &quot;Content-Type: application/json&quot; \
  -d &#39;{
    &quot;model&quot;: &quot;kling-3.0&quot;,
    &quot;prompt&quot;: &quot;A drone shot pulling back from a mountain lake at sunrise, mist rising off the water, cinematic lighting&quot;,
    &quot;duration_seconds&quot;: 5,
    &quot;aspect_ratio&quot;: &quot;16:9&quot;,
    &quot;enable_sound&quot;: true,
    &quot;output_resolution&quot;: &quot;1080p&quot;
  }&#39;

```

### Response

```json
{
  &quot;task_id&quot;: &quot;tsk_abc123&quot;,
  &quot;status&quot;: &quot;pending&quot;,
  &quot;model&quot;: &quot;kling-3.0&quot;
}

```

## How it works

1. **RunAPI 설정** — RUNAPI_API_KEY 환경 변수를 설정하세요. OpenClaw에서 채팅용 RunAPI 프로바이더를 이미 설정했다면, 동일한 key가 영상 생성에도 사용됩니다 — 추가 설정이 필요 없습니다.
2. **Kling text_to_video 호출** — model을 kling-3.0으로 설정하여 /api/v1/kling/text_to_video에 POST 요청을 보내세요. 프롬프트, duration_seconds (3~15), aspect_ratio를 포함하고 선택적으로 enable_sound로 네이티브 오디오를 활성화하세요. 이미지 기반 생성의 경우, first_frame_image_url을 사용하여 /api/v1/kling/image_to_video를 사용하세요.
3. **결과 가져오기** — 엔드포인트는 즉시 task_id를 반환합니다. 상태가 completed로 변경될 때까지 작업 상태 엔드포인트를 폴링한 후 응답에서 영상 URL을 가져오세요. 생성에는 일반적으로 길이와 해상도에 따라 30~120초가 소요됩니다.

## Parameters

| Parameter | Type | Description |
|-----------|------|-------------|
| `model` | `string` | 필수. kling-3.0은 최신 버전입니다. |
| `prompt` | `string` | 영상 설명. multi_shots가 활성화되지 않은 경우 필수. |
| `duration_seconds` | `integer` | 영상 길이. Kling 3.0은 3~15초를 지원합니다. 이전 버전은 5초 또는 10초. |
| `aspect_ratio` | `string` | 출력 화면 비율: 16:9, 9:16, 또는 1:1. |
| `output_resolution` | `string` | 해상도: 720p, 1080p, 또는 4k. 해상도가 높을수록 초당 비용이 더 많이 듭니다. |
| `enable_sound` | `boolean` | 영상과 함께 네이티브 오디오를 생성합니다. 초당 비용이 증가합니다. |
| `negative_prompt` | `string` | 생성에서 제외할 요소. |
| `first_frame_image_url` | `string` | 시작 프레임으로 사용할 이미지 URL (싱글샷 모드). |
| `cfg_scale` | `number` | 가이던스 스케일 (0~1). 값이 높을수록 프롬프트를 더 엄격히 따릅니다. |
| `multi_shots` | `boolean` | 세그먼트별로 별도의 프롬프트를 사용하여 멀티샷 장면 생성을 활성화합니다. |

## FAQ

### RunAPI에서 Kling 초당 청구 방식은 어떻게 작동하나요?

Kling은 생성된 영상의 초당 요금을 부과합니다. 요금은 output_resolution과 enable_sound 활성화 여부에 따라 다릅니다. 사운드 없는 5초 720p 클립이 가장 저렴한 옵션이며, 사운드가 포함된 1080p는 초당 약 두 배의 비용이 듭니다. 정확한 요금은 RunAPI 가격 페이지를 확인하세요.

### text_to_video와 image_to_video의 차이점은 무엇인가요?

text_to_video는 텍스트 프롬프트만으로 클립을 생성합니다. image_to_video는 first_frame_image_url이 필요하며 해당 이미지로부터 애니메이션을 생성합니다. 두 엔드포인트 모두 비동기 task_id를 반환하며 동일한 길이와 해상도 옵션을 지원합니다.

### Kling이 사운드가 포함된 영상을 생성할 수 있나요?

네. 요청 본문에서 enable_sound를 true로 설정하세요. Kling 3.0은 영상 내용에 맞는 동기화된 오디오를 생성합니다. 사운드 생성은 초당 비용을 증가시킵니다 — 720p에서는 초당 약 3센트가 추가됩니다.

### Kling 3.0이 지원하는 최대 영상 길이는 얼마인가요?

Kling 3.0은 duration_seconds 파라미터를 통해 3~15초를 지원합니다. kling-v2.5-turbo-text-to-video-pro와 같은 이전 버전은 5초 또는 10초만 허용합니다.

### Kling 영상에서 카메라 모션을 제어할 수 있나요?

Kling 3.0에는 소스 이미지에 레퍼런스 영상으로 모션 프리셋을 적용하는 별도의 motion_control 엔드포인트(/api/v1/kling/motion_control)가 있습니다. text_to_video 엔드포인트는 카메라 방향에 대한 프롬프트 설명에 의존합니다.


## Links

- [OpenClaw 설정 가이드 →](https://runapi.ai/ko/openclaw)
- [Kling 모델 →](https://runapi.ai/ko/models/kling)
- [Model catalog](https://runapi.ai/ko/models)
- [API docs](https://runapi.ai/ko/docs)
