HERMES + WAN

Hermes Agent에서 Wan을 사용하세요.

Wan은 Alibaba의 오픈소스 영상 및 이미지 생성 모델로, Apache 2.0 라이선스이며 Artificial Analysis 텍스트-비디오 리더보드에서

하나의 API key · 20개 이상의 Wan 변형 · Apache 2.0 오픈소스
Use RunAPI to generate a video with Alibaba Wan 2.7.

Requirements:
- Read the API key from RUNAPI_API_KEY.
- Use the custom:runapi provider with base_url https://runapi.ai/v1.
- Call POST https://runapi.ai/api/v1/task/text_to_video
- Set model to "wan-2.7-text-to-video".
- Set output_resolution to "1080p" for full HD output.
- Include a detailed prompt describing the scene, camera motion, and lighting.
- The response is async. Poll the returned task_id until status is "completed".
- When done, read the video URL from the response output.
curl -X POST https://runapi.ai/api/v1/task/text_to_video \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "wan-2.7-text-to-video",
    "prompt": "A drone shot rising over terraced rice paddies at golden hour, mist rolling through the valleys, slow upward camera tilt",
    "output_resolution": "1080p"
  }'
{
  "task_id": "tsk_abc123",
  "status": "pending",
  "model": "wan-2.7-text-to-video"
}
curl 명령어를 복사하여 테스트하세요 wan
작동 방식

Hermes Agent에서 Wan을 세 단계로 사용하기

1

RunAPI 설정

Hermes Agent가 실행되는 환경에 RUNAPI_API_KEY를 설정하세요. custom:runapi 프로바이더로 RunAPI를 이미 추가했다면, 동일한 key와 base_url이 모든 Wan 엔드포인트를 처리합니다 — 추가 설정이 필요 없습니다.

export RUNAPI_API_KEY=runapi_xxx
2

Wan 엔드포인트 호출

model을 wan-2.7-text-to-video로 설정하고 output_resolution을 720p 또는 1080p로 설정하여 text_to_video에 POST 요청을 보내세요. 이미지-비디오는 first_frame_image_url과 함께 wan-2.7-image-to-video를 사용하세요. 음성 기반 영상은 source_audio_url과 source_image_url과 함께 wan-2.2-a14b-speech-to-video-turbo를 사용하세요. Hermes Agent는 custom:runapi 프로바이더를 통해 모든 요청을 라우팅합니다.

POST /api/v1/task/text_to_video
3

결과 가져오기

엔드포인트는 즉시 task_id를 반환합니다. 상태가 completed가 될 때까지 작업 상태 엔드포인트를 폴링한 후 응답에서 출력 영상 또는 이미지 URL을 읽으세요. RunAPI SDK와 CLI는 폴링을 자동으로 처리합니다.

GET /api/v1/task/text_to_video/tsk_abc123
파라미터

Wan text_to_video API 파라미터

파라미터 유형 설명
model string 필수. wan-2.7-text-to-video, wan-2.6-text-to-video, wan-2.5-text-to-video, wan-2.2-a14b-text-to-video-turbo, 또는 wan-2.7-r2v.
prompt string 필수. 카메라 모션, 조명, 피사체 세부 사항을 포함한 원하는 영상 장면의 텍스트 설명.
output_resolution string 선택 사항. Wan 2.5+ 는 720p 또는 1080p. Wan 2.2는 480p와 580p도 허용. 기본값 720p.
aspect_ratio string 선택 사항. wan-2.7-r2v 전용. 허용 값: 16:9, 9:16, 1:1, 4:3, 3:4.
duration_seconds integer 선택 사항. wan-2.7-r2v 전용. 영상 길이(초), 2~10.
seed integer 선택 사항. 결정론적 출력을 위한 재현성 시드.
callback_url string 선택 사항. 작업 완료 시 POST를 수신하는 웹훅 URL.

Hermes Agent의 Wan이란?

Wan은 Alibaba의 Apache 2.0 오픈소스 동영상 모델로 Artificial Analysis 리더보드 1위에 올라 있으며, 프레임 수준의 제어 정밀도·캐릭터 일관성·네이티브 립싱크로 알려져 있습니다. Hermes Agent를 통해 최대 1080p의 텍스트→동영상·이미지→동영상이 가능하며, 20개 이상의 변형 모두에 단일 provider 설정으로 접근할 수 있습니다.

Wan 활용 사례

대규모 브랜드 콘텐츠

Wan의 캐릭터 일관성을 활용해 대량의 브랜드 동영상 콘텐츠를 제작합니다. Hermes Agent는 다양한 제품 라인에 걸쳐 생성 작업을 병렬로 디스패치할 수 있습니다.

립싱크가 있는 대화 콘텐츠

단일 Hermes Agent 워크플로에서 ElevenLabs TTS와 Wan의 음성→동영상 엔드포인트를 연결해 스크립트 텍스트에서 립싱크 토킹 동영상을 수동 개입 없이 바로 생성합니다.

영화·광고 대행사 사전 시각화

엔드포인트 고정 키프레임으로 제작급 사전 시각화 클립을 생성합니다. 첫 프레임·마지막 프레임 이미지를 설정해 클라이언트 검토를 위한 정확한 장면 전환을 제어합니다.

FAQ

Wan + Hermes Agent 자주 묻는 질문

Hermes Agent 일반 설정

아직 설정하지 않으셨나요? Hermes Agent용 RunAPI 설정 가이드로 시작하세요.

Hermes Agent 설정 가이드 →

Wan 모델 카탈로그

20개 이상의 Wan 변형, 가격, 엔드포인트 문서를 확인하세요.

RunAPI의 Wan →

지금 Hermes Agent에서 Wan을 사용해보세요.

무료 RunAPI key를 발급받고, custom:runapi 프로바이더를 설정하여 #1 오픈소스 모델로 영상을 생성하세요 — 텍스트-비디오, 이미지-비디오, 또는 음성-비디오.