OpenClaw에서 Kling을 사용하세요.
Kuaishou의 Kling 3.0은 텍스트 또는 이미지로부터 최대 1080p의 영상을 네이티브 오디오, 멀티샷 장면, 3~15초 길이로 생성합니다. OpenClaw 에이전트는 채팅에 사용하는 것과 동일한 API key로 RunAPI를 통해 호출합니다. 프롬프트를 보내고, 작업을 폴링하여 영상 URL을 받으세요.
Use RunAPI to generate a video with Kling 3.0.
Requirements:
- Call POST https://runapi.ai/api/v1/kling/text_to_video
- Set model to "kling-3.0"
- Read the API key from RUNAPI_API_KEY environment variable
- Set duration_seconds to control length (3–15 seconds)
- Set aspect_ratio to "16:9" for landscape video
- Enable sound with enable_sound: true for native audio
- The response is async — poll the task status endpoint until the task completes, then retrieve the video URL
curl -X POST https://runapi.ai/api/v1/kling/text_to_video \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "kling-3.0",
"prompt": "A drone shot pulling back from a mountain lake at sunrise, mist rising off the water, cinematic lighting",
"duration_seconds": 5,
"aspect_ratio": "16:9",
"enable_sound": true,
"output_resolution": "1080p"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "kling-3.0"
}
OpenClaw에서 Kling을 세 단계로 사용하기
RunAPI 설정
RUNAPI_API_KEY 환경 변수를 설정하세요. OpenClaw에서 채팅용 RunAPI 프로바이더를 이미 설정했다면, 동일한 key가 영상 생성에도 사용됩니다 — 추가 설정이 필요 없습니다.
export RUNAPI_API_KEY=runapi_xxx
Kling text_to_video 호출
model을 kling-3.0으로 설정하여 /api/v1/kling/text_to_video에 POST 요청을 보내세요. 프롬프트, duration_seconds (3~15), aspect_ratio를 포함하고 선택적으로 enable_sound로 네이티브 오디오를 활성화하세요. 이미지 기반 생성의 경우, first_frame_image_url을 사용하여 /api/v1/kling/image_to_video를 사용하세요.
POST /api/v1/kling/text_to_video
결과 가져오기
엔드포인트는 즉시 task_id를 반환합니다. 상태가 completed로 변경될 때까지 작업 상태 엔드포인트를 폴링한 후 응답에서 영상 URL을 가져오세요. 생성에는 일반적으로 길이와 해상도에 따라 30~120초가 소요됩니다.
GET /api/v1/kling/text_to_video/tsk_abc123
Kling text_to_video API 파라미터
| 파라미터 | 유형 | 설명 |
|---|---|---|
model |
string |
필수. kling-3.0은 최신 버전입니다. |
prompt |
string |
영상 설명. multi_shots가 활성화되지 않은 경우 필수. |
duration_seconds |
integer |
영상 길이. Kling 3.0은 3~15초를 지원합니다. 이전 버전은 5초 또는 10초. |
aspect_ratio |
string |
출력 화면 비율: 16:9, 9:16, 또는 1:1. |
output_resolution |
string |
해상도: 720p, 1080p, 또는 4k. 해상도가 높을수록 초당 비용이 더 많이 듭니다. |
enable_sound |
boolean |
영상과 함께 네이티브 오디오를 생성합니다. 초당 비용이 증가합니다. |
negative_prompt |
string |
생성에서 제외할 요소. |
first_frame_image_url |
string |
시작 프레임으로 사용할 이미지 URL (싱글샷 모드). |
cfg_scale |
number |
가이던스 스케일 (0~1). 값이 높을수록 프롬프트를 더 엄격히 따릅니다. |
multi_shots |
boolean |
세그먼트별로 별도의 프롬프트를 사용하여 멀티샷 장면 생성을 활성화합니다. |
OpenClaw의 Kling이란?
Kuaishou의 Kling 3.0은 뛰어난 천 시뮬레이션·유체 역학·모션 물리로 영화급 품질의 동영상으로 알려져 있습니다. 텍스트 또는 이미지에서 최장 3분·최대 1080p의 동영상을 네이티브 오디오와 멀티샷 장면으로 생성합니다. OpenClaw agent는 RunAPI 엔드포인트를 통해 채팅과 동일한 API 키로 호출합니다.
Kling 활용 사례
B-롤 및 인서트 컷 소스
빡빡한 마감일을 위해 장면 길이의 B-롤 영상을 생성합니다——자연 풍경·여행 콘텐츠·환경 영상에서 Kling의 모션 물리와 영화 조명이 두드러집니다.
제품 라이프스타일 콘텐츠
이미지 한 장 또는 텍스트 프롬프트만으로 식품·패션·라이프스타일 브랜드의 제품 동영상을 자연스러운 카메라 무브먼트와 사실적인 재질 렌더링으로 제작합니다.
소셜 미디어 짧은 클립
영화감 있는 구도로 TikTok·Reels·YouTube Shorts용 짧은 클립을 제작합니다. duration_seconds를 5 또는 10으로 설정해 플랫폼 적합 길이로 출력합니다.
Kling + OpenClaw 자주 묻는 질문
Kling은 생성된 영상의 초당 요금을 부과합니다. 요금은 output_resolution과 enable_sound 활성화 여부에 따라 다릅니다. 사운드 없는 5초 720p 클립이 가장 저렴한 옵션이며, 사운드가 포함된 1080p는 초당 약 두 배의 비용이 듭니다. 정확한 요금은 RunAPI 가격 페이지를 확인하세요.
text_to_video는 텍스트 프롬프트만으로 클립을 생성합니다. image_to_video는 first_frame_image_url이 필요하며 해당 이미지로부터 애니메이션을 생성합니다. 두 엔드포인트 모두 비동기 task_id를 반환하며 동일한 길이와 해상도 옵션을 지원합니다.
네. 요청 본문에서 enable_sound를 true로 설정하세요. Kling 3.0은 영상 내용에 맞는 동기화된 오디오를 생성합니다. 사운드 생성은 초당 비용을 증가시킵니다 — 720p에서는 초당 약 3센트가 추가됩니다.
Kling 3.0은 duration_seconds 파라미터를 통해 3~15초를 지원합니다. kling-v2.5-turbo-text-to-video-pro와 같은 이전 버전은 5초 또는 10초만 허용합니다.
Kling 3.0에는 소스 이미지에 레퍼런스 영상으로 모션 프리셋을 적용하는 별도의 motion_control 엔드포인트(/api/v1/kling/motion_control)가 있습니다. text_to_video 엔드포인트는 카메라 방향에 대한 프롬프트 설명에 의존합니다.
지금 OpenClaw에서 Kling을 사용해보세요.
무료 RunAPI key를 발급받고, OpenClaw에 프롬프트를 붙여넣어 Kling 3.0으로 영상 생성을 시작하세요.