在 Hermes Agent 中使用 InfiniteTalk。
InfiniteTalk 從音訊檔案和臉部圖像生成對嘴同步的對嘴說話虛擬人物影片。Hermes Agent 透過 RunAPI 自訂端點呼叫它——設定一次 custom:runapi,發送 audio_to_video,然後輪詢完成的影片。
Use RunAPI to generate a talking avatar video with InfiniteTalk.
Requirements:
- Read the API key from RUNAPI_API_KEY.
- Use the custom:runapi provider with base_url https://runapi.ai/v1.
- Call POST https://runapi.ai/api/v1/infinitetalk/audio_to_video
- Set model to "infinitetalk-from-audio".
- Set source_audio_url to the URL of the audio file.
- Set source_image_url to the URL of the face image.
- Set prompt to describe the desired output.
- The task is async. Poll the returned task_id until status is "completed".
- When done, read the video URL from the response output.
curl -X POST https://runapi.ai/api/v1/infinitetalk/audio_to_video \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "infinitetalk-from-audio",
"source_audio_url": "https://example.com/speech.mp3",
"source_image_url": "https://example.com/avatar.jpg",
"prompt": "A professional presenter delivering a product overview"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "infinitetalk-from-audio"
}
三步驟在 Hermes Agent 中使用 InfiniteTalk
設定 RunAPI
在 Hermes Agent 運行的環境中設定 RUNAPI_API_KEY。如果你已將 RunAPI 新增為 custom:runapi provider,同一個 key 亦可處理 InfiniteTalk 請求。
export RUNAPI_API_KEY=runapi_xxx
呼叫 InfiniteTalk
向 audio_to_video 端點發送含有 model、音訊 URL、圖像 URL 和 prompt 的 POST 請求。Hermes Agent 可透過 custom:runapi provider 建立並發送此請求。
POST /api/v1/infinitetalk/audio_to_video
輪詢結果
端點立即返回 task_id。輪詢 task status 端點直到狀態為 completed,然後從回應中讀取輸出影片 URL。
GET /api/v1/infinitetalk/audio_to_video/tsk_abc123
InfiniteTalk API 參數
| 參數 | 類型 | 說明 |
|---|---|---|
model |
string |
必填。使用 infinitetalk-from-audio。 |
source_audio_url |
string |
必填。用於對嘴同步的來源音訊檔案 URL。 |
source_image_url |
string |
必填。要動畫化的臉部或虛擬人物圖像 URL。 |
prompt |
string |
必填。描述所需影片輸出的文字。最多 5000 個字符。 |
output_resolution |
string |
可選。輸出影片解析度。接受值:480p、720p。預設為 480p。 |
seed |
integer |
可選。可重現性種子。10000 至 1000000 之間的整數。 |
callback_url |
string |
可選。任務完成時接收 POST 的 webhook URL。 |
Hermes Agent 上的 InfiniteTalk 是什麼?
InfiniteTalk 通過音頻文件和參考圖驅動面部動畫、口型同步和頭部運動,生成説話頭像影片。Hermes Agent 通過 custom:runapi provider 呼叫它,可構建多步驟工作流程——例如先用 ElevenLabs 生成語音,再將音頻 URL 傳給 InfiniteTalk,完成完整的文字轉説話影片工作流。
InfiniteTalk 使用場景
AI 主播的 YouTube 內容
僅用一張照片為 YouTube 頻道生成説話頭像影片,無需出鏡拍攝,同時保持所有影片中主播形象的一致性。
帶口型同步的影片配音
對現有影片中的人臉進行重新動畫化,使其與不同語言的新音軌匹配,生成口型與翻譯語音同步的配音內容。
長篇講座與演示影片
僅用一張講師照片和錄製的旁白,為在線課程、網絡研討會或內部培訓製作不限時長的説話頭像影片。
InfiniteTalk + Hermes Agent 常見問題
可以。Hermes Agent 可透過 custom:runapi provider 呼叫 RunAPI InfiniteTalk 端點。在環境中設定 RUNAPI_API_KEY,並向 /api/v1/infinitetalk/audio_to_video 發送含有 model、音訊 URL 和圖像 URL 的 POST 請求。
不需要。用於聊天、圖像和影片生成的同一個 RUNAPI_API_KEY 亦適用於 InfiniteTalk。所有 RunAPI 模型共用一個 key 和一個點數餘額。
非同步。建立端點立即返回 task_id。輪詢 task status 端點,或提供 callback_url 以在影片就緒時接收 webhook。
InfiniteTalk 按任務計費。請查看 RunAPI 收費頁面了解最新價格。點數從與所有 RunAPI 模型共用的同一個餘額中扣除。
立即在 Hermes Agent 中試用 InfiniteTalk。
取得免費 RunAPI key,設定 custom:runapi provider,從任何音訊檔案生成對嘴同步的對嘴說話虛擬人物影片。