OpenClaw에서 Wan을 사용하세요.
Alibaba의 Wan 2.6과 2.7은 광범위한 영상 생성 툴킷을 제공합니다: 텍스트-비디오, 이미지-비디오, 비디오-비디오 재스타일링, 이미지 생성, 레퍼런스 가이드 편집 — 모두 프레임당 청구. OpenClaw 에이전트는 채팅에 사용하는 것과 동일한 RunAPI key로 Wan을 호출합니다.
Use RunAPI to generate a video with Alibaba Wan 2.7.
Requirements:
- Call the RunAPI text_to_video endpoint at https://runapi.ai/api/v1/task/text_to_video.
- Set model to "wan-2.7-text-to-video".
- Read the API key from the RUNAPI_API_KEY environment variable.
- Set output_resolution to "1080p" for full HD output.
- Include a detailed prompt describing the scene, camera motion, and lighting.
- The response is async. Poll the returned task_id until status is "completed".
- When done, read the video URL from the response output.
curl -X POST https://runapi.ai/api/v1/task/text_to_video \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "wan-2.7-text-to-video",
"prompt": "A drone shot rising over terraced rice paddies at golden hour, mist rolling through the valleys, slow upward camera tilt",
"output_resolution": "1080p"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "wan-2.7-text-to-video"
}
OpenClaw에서 Wan을 세 단계로 사용하기
RunAPI 설정
환경에 RUNAPI_API_KEY를 설정하세요. RunAPI가 이미 OpenClaw의 채팅 프로바이더로 설정되어 있다면, 동일한 key로 모든 Wan 엔드포인트를 지원합니다.
export RUNAPI_API_KEY=runapi_xxx
Wan 엔드포인트 호출
입력에 맞는 엔드포인트를 선택하세요: 텍스트 프롬프트의 경우 text_to_video (wan-2.7-text-to-video), 소스 이미지의 경우 image_to_video (wan-2.7-image-to-video), 기존 클립을 재스타일링하려면 video_to_video (wan-2.6-video-to-video). model, prompt, 그리고 소스 URL을 전달하세요.
POST /api/v1/task/text_to_video
결과 가져오기
엔드포인트는 task_id를 반환합니다. 완료될 때까지 폴링하여 출력 URL을 가져오세요. 청구는 생성된 영상의 프레임당 계산됩니다 — 5초 30fps 클립은 150프레임을 생성합니다.
GET /api/v1/task/text_to_video/tsk_abc123
Wan text_to_video 파라미터
| 파라미터 | 유형 | 설명 |
|---|---|---|
model |
string |
필수. wan-2.7-text-to-video, wan-2.7-image-to-video, wan-2.6-text-to-video, wan-2.6-image-to-video, wan-2.6-video-to-video, wan-2.6-flash-image-to-video, wan-2.6-flash-video-to-video, 또는 이전 변형. |
prompt |
string |
생성할 장면의 텍스트 설명. 모든 텍스트 입력 엔드포인트에서 필수. |
output_resolution |
string |
영상 해상도. 허용 값: 480p, 720p, 1080p. |
aspect_ratio |
string |
출력 화면 비율. 허용 값: 16:9, 9:16, 1:1. |
first_frame_image_url |
string |
이미지-비디오 또는 이미지-이미지 엔드포인트를 위한 소스 이미지 URL. |
source_video_url |
string |
비디오-비디오 재스타일링을 위한 소스 영상 URL. |
negative_prompt |
string |
선택 사항. 생성에서 제외할 요소. |
callback_url |
string |
선택 사항. 작업 완료 시 POST를 수신하는 웹훅 URL. |
OpenClaw의 Wan이란?
Wan은 Alibaba가 출시한 오픈소스(Apache 2.0) 동영상 모델로 Artificial Analysis 텍스트→동영상 리더보드 1위에 랭크되어 있습니다. 엔드포인트 고정 생성을 위한 첫 프레임·마지막 프레임 제어, 캐릭터 일관성이 있는 멀티샷 동영상, 립싱크 음성→동영상을 포함한 네이티브 오디오 지원을 제공합니다. OpenClaw agent는 단일 API 키로 20개 이상의 Wan 변형 전체에 접근할 수 있습니다.
Wan 활용 사례
스토리보드→동영상 워크플로
첫 프레임·마지막 프레임 앵커링을 사용해 스토리보드 패널을 동영상 시퀀스로 변환합니다. 각 클립이 키프레임에서 시작·종료하며 멀티샷 프로젝트 전체의 시각적 연속성을 유지합니다.
가상 발표자 및 브랜드 마스코트
Wan의 음성→동영상 엔드포인트를 사용해 얼굴 이미지와 오디오 파일에서 토킹 헤드 동영상을 생성합니다. 모델이 립싱크와 머리 움직임을 처리해 일관된 브랜드 대변인 콘텐츠를 만들어냅니다.
캐릭터 일관성이 있는 멀티샷 시퀀스
여러 클립에 걸쳐 동일한 캐릭터가 등장하는 대화가 많은 내러티브 콘텐츠를 구성합니다. Wan의 시간적 일관성이 샷 간에 얼굴과 의상을 안정적으로 유지합니다.
Wan + OpenClaw 자주 묻는 질문
Wan은 Alibaba의 오픈 영상 생성 모델 패밀리입니다. RunAPI는 텍스트-비디오, 이미지-비디오, 비디오-비디오 엔드포인트에 걸쳐 Wan 2.5, 2.6, 2.7을 지원합니다. Wan 2.7은 텍스트 및 이미지 입력을 위한 현재 세대이며, Wan 2.6은 비디오-비디오 재스타일링과 더 빠른 생성을 위한 flash 변형을 추가합니다.
Wan 2.7은 텍스트-비디오와 이미지-비디오의 모션 일관성과 시각적 품질을 향상시킵니다. Wan 2.6은 아직 2.7에서 사용할 수 없는 비디오-비디오와 flash 엔드포인트를 추가합니다. 대부분의 새 프로젝트의 경우 wan-2.7-text-to-video로 시작하고, 비디오-비디오가 필요하거나 flash 속도 티어를 원한다면 2.6을 사용하세요.
Wan은 초당이 아닌 생성된 출력의 프레임당 요금을 부과합니다. 5초 30fps 영상은 150프레임에 해당합니다. 해상도는 프레임당 요금에 영향을 미칩니다 — 1080p는 480p보다 프레임당 비용이 더 높습니다. 정확한 프레임 수와 비용은 완료된 작업 응답에 나타납니다.
네. source_video_url과 대상 스타일을 설명하는 프롬프트로 wan-2.6-video-to-video 또는 wan-2.6-flash-video-to-video 모델을 사용하세요. Wan은 소스의 모션과 구조를 유지하면서 모든 프레임에 프롬프트의 시각적 스타일을 적용합니다.
지금 OpenClaw에서 Wan을 사용해보세요.
무료 RunAPI key를 발급받고, OpenClaw에 프롬프트를 붙여넣어 Alibaba Wan 2.7로 영상을 생성하세요.