Hermes Agent에서 Wan을 사용하세요.
Wan은 Alibaba의 오픈소스 영상 및 이미지 생성 모델로, Apache 2.0 라이선스이며 Artificial Analysis 텍스트-비디오 리더보드에서
Use RunAPI to generate a video with Alibaba Wan 2.7.
Requirements:
- Read the API key from RUNAPI_API_KEY.
- Use the custom:runapi provider with base_url https://runapi.ai/v1.
- Call POST https://runapi.ai/api/v1/task/text_to_video
- Set model to "wan-2.7-text-to-video".
- Set output_resolution to "1080p" for full HD output.
- Include a detailed prompt describing the scene, camera motion, and lighting.
- The response is async. Poll the returned task_id until status is "completed".
- When done, read the video URL from the response output.
curl -X POST https://runapi.ai/api/v1/task/text_to_video \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "wan-2.7-text-to-video",
"prompt": "A drone shot rising over terraced rice paddies at golden hour, mist rolling through the valleys, slow upward camera tilt",
"output_resolution": "1080p"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "wan-2.7-text-to-video"
}
Hermes Agent에서 Wan을 세 단계로 사용하기
RunAPI 설정
Hermes Agent가 실행되는 환경에 RUNAPI_API_KEY를 설정하세요. custom:runapi 프로바이더로 RunAPI를 이미 추가했다면, 동일한 key와 base_url이 모든 Wan 엔드포인트를 처리합니다 — 추가 설정이 필요 없습니다.
export RUNAPI_API_KEY=runapi_xxx
Wan 엔드포인트 호출
model을 wan-2.7-text-to-video로 설정하고 output_resolution을 720p 또는 1080p로 설정하여 text_to_video에 POST 요청을 보내세요. 이미지-비디오는 first_frame_image_url과 함께 wan-2.7-image-to-video를 사용하세요. 음성 기반 영상은 source_audio_url과 source_image_url과 함께 wan-2.2-a14b-speech-to-video-turbo를 사용하세요. Hermes Agent는 custom:runapi 프로바이더를 통해 모든 요청을 라우팅합니다.
POST /api/v1/task/text_to_video
결과 가져오기
엔드포인트는 즉시 task_id를 반환합니다. 상태가 completed가 될 때까지 작업 상태 엔드포인트를 폴링한 후 응답에서 출력 영상 또는 이미지 URL을 읽으세요. RunAPI SDK와 CLI는 폴링을 자동으로 처리합니다.
GET /api/v1/task/text_to_video/tsk_abc123
Wan text_to_video API 파라미터
| 파라미터 | 유형 | 설명 |
|---|---|---|
model |
string |
필수. wan-2.7-text-to-video, wan-2.6-text-to-video, wan-2.5-text-to-video, wan-2.2-a14b-text-to-video-turbo, 또는 wan-2.7-r2v. |
prompt |
string |
필수. 카메라 모션, 조명, 피사체 세부 사항을 포함한 원하는 영상 장면의 텍스트 설명. |
output_resolution |
string |
선택 사항. Wan 2.5+ 는 720p 또는 1080p. Wan 2.2는 480p와 580p도 허용. 기본값 720p. |
aspect_ratio |
string |
선택 사항. wan-2.7-r2v 전용. 허용 값: 16:9, 9:16, 1:1, 4:3, 3:4. |
duration_seconds |
integer |
선택 사항. wan-2.7-r2v 전용. 영상 길이(초), 2~10. |
seed |
integer |
선택 사항. 결정론적 출력을 위한 재현성 시드. |
callback_url |
string |
선택 사항. 작업 완료 시 POST를 수신하는 웹훅 URL. |
Hermes Agent의 Wan이란?
Wan은 Alibaba의 Apache 2.0 오픈소스 동영상 모델로 Artificial Analysis 리더보드 1위에 올라 있으며, 프레임 수준의 제어 정밀도·캐릭터 일관성·네이티브 립싱크로 알려져 있습니다. Hermes Agent를 통해 최대 1080p의 텍스트→동영상·이미지→동영상이 가능하며, 20개 이상의 변형 모두에 단일 provider 설정으로 접근할 수 있습니다.
Wan 활용 사례
대규모 브랜드 콘텐츠
Wan의 캐릭터 일관성을 활용해 대량의 브랜드 동영상 콘텐츠를 제작합니다. Hermes Agent는 다양한 제품 라인에 걸쳐 생성 작업을 병렬로 디스패치할 수 있습니다.
립싱크가 있는 대화 콘텐츠
단일 Hermes Agent 워크플로에서 ElevenLabs TTS와 Wan의 음성→동영상 엔드포인트를 연결해 스크립트 텍스트에서 립싱크 토킹 동영상을 수동 개입 없이 바로 생성합니다.
영화·광고 대행사 사전 시각화
엔드포인트 고정 키프레임으로 제작급 사전 시각화 클립을 생성합니다. 첫 프레임·마지막 프레임 이미지를 설정해 클라이언트 검토를 위한 정확한 장면 전환을 제어합니다.
Wan + Hermes Agent 자주 묻는 질문
모두 사용 가능합니다. text_to_video, image_to_video, speech_to_video, text_to_image (Wan 2.7 Image), edit_video, animate. RunAPI를 custom:runapi 프로바이더로 한 번 설정하면 요청당 엔드포인트와 모델 슬러그를 전환할 수 있습니다 — 예를 들어 영상은 wan-2.7-text-to-video, 4K 이미지 생성은 wan-2.7-image.
base_url을 https://runapi.ai/v1로, API key를 RUNAPI_API_KEY로 설정하여 custom:runapi 프로바이더 항목을 추가하세요. 설정이 완료되면 모든 Wan 엔드포인트 — 및 113개 이상의 RunAPI 모델 전체 — 가 추가 플러그인 없이 동일한 프로바이더를 통해 접근 가능합니다.
Wan 2.5는 1080p 출력을 도입했습니다. Wan 2.6은 영상 편집(R2V)과 더 빠른 생성을 위한 flash 변형을 추가했습니다. Wan 2.7은 이미지 생성(wan-2.7-image, wan-2.7-image-pro 최대 4K), 영상 편집(wan-2.7-edit-video), 그리고 Artificial Analysis 리더보드를 선도하는 향상된 텍스트-비디오 품질을 추가합니다.
source_audio_url(오디오 파일)과 source_image_url(애니메이션할 얼굴)과 함께 wan-2.2-a14b-speech-to-video-turbo를 사용하세요. Wan은 얼굴이 오디오를 말하는 립싱크 영상을 생성합니다. 출력 해상도는 480p, 580p, 720p를 지원합니다.
네. Wan은 Alibaba가 Apache 2.0으로 출시했으며 모델 가중치가 공개되어 있습니다. RunAPI를 통해 GPU 설정 없이 API 한 번의 호출로 영상과 이미지를 생성할 수 있습니다. 개인 정보 보호를 위한 자체 호스팅 파이프라인이 필요하다면 동일한 가중치를 자체 인프라에서 실행할 수 있습니다.
지금 Hermes Agent에서 Wan을 사용해보세요.
무료 RunAPI key를 발급받고, custom:runapi 프로바이더를 설정하여 #1 오픈소스 모델로 영상을 생성하세요 — 텍스트-비디오, 이미지-비디오, 또는 음성-비디오.