HERMES + INFINITETALK

Hermes Agent에서 InfiniteTalk 사용하기.

InfiniteTalk는 오디오 파일과 얼굴 이미지로 립싱크 아바타 비디오를 생성합니다. Hermes Agent는 RunAPI custom endpoint를 통해 호출합니다 — custom:runapi를 한 번 설정하고, audio_to_video를 보내고, 완성된 비디오를 폴링하세요.

하나의 API key · 오디오-비디오 엔드포인트 · 비동기 작업 폴링
Use RunAPI to generate a talking avatar video with InfiniteTalk.

Requirements:
- Read the API key from RUNAPI_API_KEY.
- Use the custom:runapi provider with base_url https://runapi.ai/v1.
- Call POST https://runapi.ai/api/v1/infinitetalk/audio_to_video
- Set model to "infinitetalk-from-audio".
- Set source_audio_url to the URL of the audio file.
- Set source_image_url to the URL of the face image.
- Set prompt to describe the desired output.
- The task is async. Poll the returned task_id until status is "completed".
- When done, read the video URL from the response output.
curl -X POST https://runapi.ai/api/v1/infinitetalk/audio_to_video \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "infinitetalk-from-audio",
    "source_audio_url": "https://example.com/speech.mp3",
    "source_image_url": "https://example.com/avatar.jpg",
    "prompt": "A professional presenter delivering a product overview"
  }'
{
  "task_id": "tsk_abc123",
  "status": "pending",
  "model": "infinitetalk-from-audio"
}
curl 명령어를 복사하여 테스트하세요 infinitetalk
작동 방식

Hermes Agent에서 InfiniteTalk를 세 단계로 사용하기

1

RunAPI 설정

Hermes Agent가 실행되는 환경에 RUNAPI_API_KEY를 설정하세요. 이미 채팅용 custom:runapi provider로 RunAPI를 추가했다면, 동일한 key가 InfiniteTalk 요청에도 사용됩니다.

export RUNAPI_API_KEY=runapi_xxx
2

InfiniteTalk 호출

model, 오디오 URL, 이미지 URL, 출력을 설명하는 프롬프트를 포함하여 audio_to_video endpoint에 POST 요청을 보내세요. Hermes Agent는 custom:runapi provider를 통해 이 요청을 빌드하고 보낼 수 있습니다.

POST /api/v1/infinitetalk/audio_to_video
3

결과 폴링

endpoint는 즉시 task_id를 반환합니다. status가 completed가 될 때까지 task status endpoint를 폴링한 뒤, 응답에서 출력 비디오 URL을 읽으세요.

GET /api/v1/infinitetalk/audio_to_video/tsk_abc123
파라미터

InfiniteTalk API 파라미터

파라미터 유형 설명
model string 필수. infinitetalk-from-audio를 사용하세요.
source_audio_url string 필수. 립싱크할 소스 오디오 파일의 URL.
source_image_url string 필수. 애니메이션할 얼굴 또는 아바타 이미지의 URL.
prompt string 필수. 원하는 비디오 출력에 대한 텍스트 설명. 최대 5000자.
output_resolution string 선택 사항. 출력 비디오 해상도. 허용 값: 480p, 720p. 기본값은 480p.
seed integer 선택 사항. 재현성 시드. 10000~1000000 사이의 정수.
callback_url string 선택 사항. task가 완료되면 POST를 받는 webhook URL.

Hermes Agent의 InfiniteTalk이란?

InfiniteTalk은 오디오 파일과 참조 이미지로 얼굴 애니메이션·입 동작·머리 움직임을 구동해 토킹 아바타 동영상을 생성합니다. Hermes Agent는 custom:runapi provider를 통해 호출하며, 멀티 스텝 파이프라인을 구성할 수 있습니다——ElevenLabs로 음성을 생성한 후 해당 오디오 URL을 InfiniteTalk에 전달해 텍스트에서 완전한 토킹 동영상 워크플로를 완성하는 방식입니다.

InfiniteTalk 활용 사례

AI 진행자를 활용한 YouTube 콘텐츠

사진 한 장으로 YouTube 채널용 토킹 헤드 동영상을 생성하며, 카메라 출연 없이 모든 동영상에서 일관된 진행자를 유지합니다.

립싱크가 적용된 동영상 더빙

기존 동영상의 얼굴을 다시 애니메이션화해 다른 언어의 새 오디오 트랙에 맞추고, 입 움직임이 번역된 음성과 동기화된 더빙 콘텐츠를 제작합니다.

장편 강의 및 프레젠테이션 동영상

강사 사진 한 장과 녹음된 내레이션만으로 온라인 강좌·웨비나·사내 교육용 무제한 길이의 토킹 아바타 동영상을 제작합니다.

FAQ

InfiniteTalk + Hermes Agent 자주 묻는 질문

Hermes Agent 일반 설정

아직 설정하지 않으셨나요? Hermes Agent용 RunAPI 설정 가이드로 시작하세요.

Hermes Agent 설정 가이드 →

InfiniteTalk 모델 카탈로그

InfiniteTalk 변형, 가격, API 문서를 확인하세요.

RunAPI의 InfiniteTalk →

지금 Hermes Agent에서 InfiniteTalk를 사용해보세요.

무료 RunAPI key를 발급받고, custom:runapi provider를 설정한 뒤 모든 오디오 파일로 립싱크 아바타 비디오를 생성해보세요.