在 OpenClaw 中使用 InfiniteTalk。
InfiniteTalk 根據音訊檔案和人臉圖像生成口型同步的數位人影片。OpenClaw agent 透過 RunAPI 使用與聊天相同的 API key 呼叫它——發送 audio_to_video,輪詢任務,接收影片 URL。
Use RunAPI to generate a talking avatar video with InfiniteTalk.
Requirements:
- Read the API key from RUNAPI_API_KEY.
- Call POST https://runapi.ai/api/v1/infinitetalk/audio_to_video
- Set model to "infinitetalk-from-audio".
- Set source_audio_url to the URL of the audio file.
- Set source_image_url to the URL of the face image.
- Set prompt to describe the desired output.
- The task is async. Poll the returned task_id until status is "completed".
- When done, read the video URL from the response output.
curl -X POST https://runapi.ai/api/v1/infinitetalk/audio_to_video \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "infinitetalk-from-audio",
"source_audio_url": "https://example.com/speech.mp3",
"source_image_url": "https://example.com/avatar.jpg",
"prompt": "A professional presenter delivering a product overview"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "infinitetalk-from-audio"
}
三步在 OpenClaw 中使用 InfiniteTalk
設定 RunAPI
在環境中設定 RUNAPI_API_KEY。若已在 OpenClaw 中為聊天設定了 RunAPI,同一個 key 也適用於 InfiniteTalk,無需額外 provider 設定。
export RUNAPI_API_KEY=runapi_xxx
呼叫 InfiniteTalk
向 audio_to_video 端點發送 POST 請求,包含 model、音訊 URL、圖像 URL 和描述輸出的提示詞。OpenClaw 可以在你的 agent 工作流程中建構並發送此請求。
POST /api/v1/infinitetalk/audio_to_video
輪詢結果
端點立即傳回 task_id。輪詢任務狀態端點,直到狀態為 completed,然後從回應中讀取輸出影片 URL。
GET /api/v1/infinitetalk/audio_to_video/tsk_abc123
InfiniteTalk API 參數
| 參數 | 類型 | 說明 |
|---|---|---|
model |
string |
必填。使用 infinitetalk-from-audio。 |
source_audio_url |
string |
必填。用於口型同步的來源音訊檔案 URL。 |
source_image_url |
string |
必填。用於動畫化的人臉或頭像圖像 URL。 |
prompt |
string |
必填。對所需影片輸出的文字描述,最多 5000 個字元。 |
output_resolution |
string |
選填。輸出影片解析度。可選值:480p、720p,預設 480p。 |
seed |
integer |
選填。可重現性種子。10000 到 1000000 之間的整數。 |
callback_url |
string |
選填。任務完成時接收 POST 的 webhook URL。 |
OpenClaw 上的 InfiniteTalk 是什麼?
InfiniteTalk 是一款音訊驅動的虛擬形象模型,能將一張照片和一段音訊檔案轉換為嘴型同步的影片,附帶頭部動作、面部表情和身體姿態。OpenClaw 代理透過 RunAPI 呼叫它,無需攝影設備或動態捕捉設備,即可製作無限長度的說話人頭影片。
InfiniteTalk 使用情境
Podcast 轉影片
將 Podcast 音訊和主持人照片輸入,生成虛擬形象說話影片,讓純音訊節目轉化為 YouTube 或社群媒體的視覺內容。
教育與教學影片
用一張講師照片和錄製的解說,製作講課或教學影片,無需架設攝影機即可產出長篇說話人頭內容。
行銷數位代言人
從一張參考圖片建立品牌數位主播,再透過替換音訊軌道,以多種語言生成代言人影片。
InfiniteTalk + OpenClaw 常見問題
可以。OpenClaw agent 可以直接呼叫 RunAPI InfiniteTalk 端點。使用你的 RUNAPI_API_KEY 將 RunAPI 設定為 provider,然後向 /api/v1/infinitetalk/audio_to_video 發送 POST 請求,包含 model、音訊 URL 和圖像 URL。
不需要。用於聊天、圖像和影片生成的同一個 RUNAPI_API_KEY 也適用於 InfiniteTalk。所有 RunAPI 模型共享一個 key 和一個點數餘額。
非同步。建立端點立即傳回 task_id。輪詢任務狀態端點,或提供 callback_url 以在影片準備好時接收 webhook。
InfiniteTalk 按任務計費。請查看 RunAPI 定價頁面取得最新價格。點數從所有 RunAPI 模型共用的同一餘額中扣除。