Hermes Agent에서 InfiniteTalk 사용하기.
InfiniteTalk는 오디오 파일과 얼굴 이미지로 립싱크 아바타 비디오를 생성합니다. Hermes Agent는 RunAPI custom endpoint를 통해 호출합니다 — custom:runapi를 한 번 설정하고, audio_to_video를 보내고, 완성된 비디오를 폴링하세요.
Use RunAPI to generate a talking avatar video with InfiniteTalk.
Requirements:
- Read the API key from RUNAPI_API_KEY.
- Use the custom:runapi provider with base_url https://runapi.ai/v1.
- Call POST https://runapi.ai/api/v1/infinitetalk/audio_to_video
- Set model to "infinitetalk-from-audio".
- Set source_audio_url to the URL of the audio file.
- Set source_image_url to the URL of the face image.
- Set prompt to describe the desired output.
- The task is async. Poll the returned task_id until status is "completed".
- When done, read the video URL from the response output.
curl -X POST https://runapi.ai/api/v1/infinitetalk/audio_to_video \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "infinitetalk-from-audio",
"source_audio_url": "https://example.com/speech.mp3",
"source_image_url": "https://example.com/avatar.jpg",
"prompt": "A professional presenter delivering a product overview"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "infinitetalk-from-audio"
}
Hermes Agent에서 InfiniteTalk를 세 단계로 사용하기
RunAPI 설정
Hermes Agent가 실행되는 환경에 RUNAPI_API_KEY를 설정하세요. 이미 채팅용 custom:runapi provider로 RunAPI를 추가했다면, 동일한 key가 InfiniteTalk 요청에도 사용됩니다.
export RUNAPI_API_KEY=runapi_xxx
InfiniteTalk 호출
model, 오디오 URL, 이미지 URL, 출력을 설명하는 프롬프트를 포함하여 audio_to_video endpoint에 POST 요청을 보내세요. Hermes Agent는 custom:runapi provider를 통해 이 요청을 빌드하고 보낼 수 있습니다.
POST /api/v1/infinitetalk/audio_to_video
결과 폴링
endpoint는 즉시 task_id를 반환합니다. status가 completed가 될 때까지 task status endpoint를 폴링한 뒤, 응답에서 출력 비디오 URL을 읽으세요.
GET /api/v1/infinitetalk/audio_to_video/tsk_abc123
InfiniteTalk API 파라미터
| 파라미터 | 유형 | 설명 |
|---|---|---|
model |
string |
필수. infinitetalk-from-audio를 사용하세요. |
source_audio_url |
string |
필수. 립싱크할 소스 오디오 파일의 URL. |
source_image_url |
string |
필수. 애니메이션할 얼굴 또는 아바타 이미지의 URL. |
prompt |
string |
필수. 원하는 비디오 출력에 대한 텍스트 설명. 최대 5000자. |
output_resolution |
string |
선택 사항. 출력 비디오 해상도. 허용 값: 480p, 720p. 기본값은 480p. |
seed |
integer |
선택 사항. 재현성 시드. 10000~1000000 사이의 정수. |
callback_url |
string |
선택 사항. task가 완료되면 POST를 받는 webhook URL. |
Hermes Agent의 InfiniteTalk이란?
InfiniteTalk은 오디오 파일과 참조 이미지로 얼굴 애니메이션·입 동작·머리 움직임을 구동해 토킹 아바타 동영상을 생성합니다. Hermes Agent는 custom:runapi provider를 통해 호출하며, 멀티 스텝 파이프라인을 구성할 수 있습니다——ElevenLabs로 음성을 생성한 후 해당 오디오 URL을 InfiniteTalk에 전달해 텍스트에서 완전한 토킹 동영상 워크플로를 완성하는 방식입니다.
InfiniteTalk 활용 사례
AI 진행자를 활용한 YouTube 콘텐츠
사진 한 장으로 YouTube 채널용 토킹 헤드 동영상을 생성하며, 카메라 출연 없이 모든 동영상에서 일관된 진행자를 유지합니다.
립싱크가 적용된 동영상 더빙
기존 동영상의 얼굴을 다시 애니메이션화해 다른 언어의 새 오디오 트랙에 맞추고, 입 움직임이 번역된 음성과 동기화된 더빙 콘텐츠를 제작합니다.
장편 강의 및 프레젠테이션 동영상
강사 사진 한 장과 녹음된 내레이션만으로 온라인 강좌·웨비나·사내 교육용 무제한 길이의 토킹 아바타 동영상을 제작합니다.
InfiniteTalk + Hermes Agent 자주 묻는 질문
네. Hermes Agent는 custom:runapi provider를 통해 RunAPI InfiniteTalk endpoint를 호출할 수 있습니다. 환경에 RUNAPI_API_KEY를 설정하고, model과 오디오 URL, 이미지 URL을 포함하여 /api/v1/infinitetalk/audio_to_video에 POST 요청을 보내세요.
아니요. 채팅, 이미지, 비디오 생성에 사용하는 동일한 RUNAPI_API_KEY가 InfiniteTalk에도 사용됩니다. 모든 RunAPI 모델은 하나의 key와 하나의 크레딧 잔액을 공유합니다.
비동기입니다. 생성 endpoint는 즉시 task_id를 반환합니다. task status endpoint를 폴링하거나 callback_url을 제공하여 비디오가 준비되면 webhook을 받으세요.
InfiniteTalk는 task당 청구됩니다. 현재 요금은 RunAPI 가격 페이지에서 확인하세요. 크레딧은 모든 RunAPI 모델에 사용되는 동일한 잔액에서 차감됩니다.
지금 Hermes Agent에서 InfiniteTalk를 사용해보세요.
무료 RunAPI key를 발급받고, custom:runapi provider를 설정한 뒤 모든 오디오 파일로 립싱크 아바타 비디오를 생성해보세요.