HERMES + INFINITETALK

在 Hermes Agent 中使用 InfiniteTalk。

InfiniteTalk 根據音訊檔案和人臉圖像生成口型同步的數位人影片。Hermes Agent 透過 RunAPI custom 端點呼叫它——設定一次 custom:runapi,發送 audio_to_video,輪詢取得完成的影片。

一個 API key · 音訊轉影片端點 · 非同步任務輪詢
Use RunAPI to generate a talking avatar video with InfiniteTalk.

Requirements:
- Read the API key from RUNAPI_API_KEY.
- Use the custom:runapi provider with base_url https://runapi.ai/v1.
- Call POST https://runapi.ai/api/v1/infinitetalk/audio_to_video
- Set model to "infinitetalk-from-audio".
- Set source_audio_url to the URL of the audio file.
- Set source_image_url to the URL of the face image.
- Set prompt to describe the desired output.
- The task is async. Poll the returned task_id until status is "completed".
- When done, read the video URL from the response output.
curl -X POST https://runapi.ai/api/v1/infinitetalk/audio_to_video \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "infinitetalk-from-audio",
    "source_audio_url": "https://example.com/speech.mp3",
    "source_image_url": "https://example.com/avatar.jpg",
    "prompt": "A professional presenter delivering a product overview"
  }'
{
  "task_id": "tsk_abc123",
  "status": "pending",
  "model": "infinitetalk-from-audio"
}
複製 curl 指令進行測試 infinitetalk
運作原理

三步在 Hermes Agent 中使用 InfiniteTalk

1

設定 RunAPI

在執行 Hermes Agent 的環境中設定 RUNAPI_API_KEY。若已新增 RunAPI 作為 custom:runapi provider,同一個 key 也可以處理 InfiniteTalk 請求。

export RUNAPI_API_KEY=runapi_xxx
2

呼叫 InfiniteTalk

向 audio_to_video 端點發送 POST 請求,包含 model、音訊 URL、圖像 URL 和描述輸出的提示詞。Hermes Agent 可以透過 custom:runapi provider 建構並發送此請求。

POST /api/v1/infinitetalk/audio_to_video
3

輪詢結果

端點立即傳回 task_id。輪詢任務狀態端點,直到狀態為 completed,然後從回應中讀取輸出影片 URL。

GET /api/v1/infinitetalk/audio_to_video/tsk_abc123
參數

InfiniteTalk API 參數

參數 類型 說明
model string 必填。使用 infinitetalk-from-audio。
source_audio_url string 必填。用於口型同步的來源音訊檔案 URL。
source_image_url string 必填。用於動畫化的人臉或頭像圖像 URL。
prompt string 必填。對所需影片輸出的文字描述,最多 5000 個字元。
output_resolution string 選填。輸出影片解析度。可選值:480p、720p,預設 480p。
seed integer 選填。可重現性種子。10000 到 1000000 之間的整數。
callback_url string 選填。任務完成時接收 POST 的 webhook URL。

Hermes Agent 上的 InfiniteTalk 是什麼?

InfiniteTalk 透過音訊檔案和參考圖片驅動臉部動畫、嘴型同步和頭部動作,製作虛擬形象說話影片。Hermes Agent 透過 custom:runapi provider 呼叫它,以建立多步驟流程——例如用 ElevenLabs 生成語音,再將音訊 URL 傳遞給 InfiniteTalk,完成整個文字轉說話影片的工作流程。

InfiniteTalk 使用情境

AI 主播 YouTube 內容

從一張照片為 YouTube 頻道生成說話人頭影片,無需在鏡頭前拍攝,同時保持所有影片中主播形象的一致性。

嘴型同步影片配音

重新驅動現有影片中的臉部,使其與不同語言的新音軌同步,製作嘴型動作與翻譯語音吻合的配音內容。

長篇講課與簡報影片

只需一張講師照片,從錄製的解說創建無限長度的虛擬形象說話影片,用於線上課程、網路研討會或內部培訓內容。

FAQ

InfiniteTalk + Hermes Agent 常見問題

Hermes Agent 通用設定

尚未設定?請從 Hermes Agent 的 RunAPI 設定指南開始。

Hermes Agent 設定指南 →

InfiniteTalk 模型目錄

查看 InfiniteTalk 變體、價格和 API 文件。

RunAPI 上的 InfiniteTalk →

立即在 Hermes Agent 中試用 InfiniteTalk。

取得免費 RunAPI key,設定 custom:runapi provider,從任意音訊檔案生成口型同步的數位人影片。