OPENCLAW + INFINITETALK

在 OpenClaw 中使用 InfiniteTalk。

InfiniteTalk 從音訊檔案和臉部圖像生成對嘴同步的對嘴說話虛擬人物影片。OpenClaw agent 透過 RunAPI 使用與聊天相同的 API key 呼叫它——發送 audio_to_video,輪詢任務,接收影片 URL。

一個 API key · 音訊轉影片端點 · 非同步任務輪詢
Use RunAPI to generate a talking avatar video with InfiniteTalk.

Requirements:
- Read the API key from RUNAPI_API_KEY.
- Call POST https://runapi.ai/api/v1/infinitetalk/audio_to_video
- Set model to "infinitetalk-from-audio".
- Set source_audio_url to the URL of the audio file.
- Set source_image_url to the URL of the face image.
- Set prompt to describe the desired output.
- The task is async. Poll the returned task_id until status is "completed".
- When done, read the video URL from the response output.
curl -X POST https://runapi.ai/api/v1/infinitetalk/audio_to_video \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "infinitetalk-from-audio",
    "source_audio_url": "https://example.com/speech.mp3",
    "source_image_url": "https://example.com/avatar.jpg",
    "prompt": "A professional presenter delivering a product overview"
  }'
{
  "task_id": "tsk_abc123",
  "status": "pending",
  "model": "infinitetalk-from-audio"
}
複製 curl 指令測試 infinitetalk
操作步驟

三步驟在 OpenClaw 中使用 InfiniteTalk

1

設定 RunAPI

在環境中設定 RUNAPI_API_KEY。如果你已在 OpenClaw 中為聊天設定了 RunAPI,同一個 key 亦適用於 InfiniteTalk——無需額外 provider 設定。

export RUNAPI_API_KEY=runapi_xxx
2

呼叫 InfiniteTalk

向 audio_to_video 端點發送含有 model、音訊 URL、圖像 URL 和描述輸出的 prompt 的 POST 請求。OpenClaw 可在 agent 工作流程中建立並發送此請求。

POST /api/v1/infinitetalk/audio_to_video
3

輪詢結果

端點立即返回 task_id。輪詢 task status 端點直到狀態為 completed,然後從回應中讀取輸出影片 URL。

GET /api/v1/infinitetalk/audio_to_video/tsk_abc123
參數

InfiniteTalk API 參數

參數 類型 說明
model string 必填。使用 infinitetalk-from-audio。
source_audio_url string 必填。用於對嘴同步的來源音訊檔案 URL。
source_image_url string 必填。要動畫化的臉部或虛擬人物圖像 URL。
prompt string 必填。描述所需影片輸出的文字。最多 5000 個字符。
output_resolution string 可選。輸出影片解析度。接受值:480p、720p。預設為 480p。
seed integer 可選。可重現性種子。10000 至 1000000 之間的整數。
callback_url string 可選。任務完成時接收 POST 的 webhook URL。

OpenClaw 上的 InfiniteTalk 是什麼?

InfiniteTalk 是一個音頻驅動的説話頭像模型,將一張照片和一段音頻合成為帶有頭部動作、面部表情和肢體姿態的口型同步影片。OpenClaw agent 通過 RunAPI 呼叫它,無需攝影設備或動作捕捉裝備即可生成不限時長的説話頭像影片。

InfiniteTalk 使用場景

播客轉影片

將播客音頻和主播照片輸入,生成説話頭像影片,把純音頻節目轉化為適合 YouTube 或社交媒體的影片內容。

教學與教程影片

僅用一張講師照片和錄製的講解音頻,製作講座或教程影片,無需攝像機即可產出長篇説話頭像內容。

營銷數字代言人

從一張參考圖生成品牌數字發言人,通過更換音軌即可批量生成多語言版本的代言影片。

FAQ

InfiniteTalk + OpenClaw 常見問題

OpenClaw 一般設定

尚未設定?從 OpenClaw 的 RunAPI 設定指南開始。

OpenClaw 設定指南 →

InfiniteTalk 模型目錄

查看 InfiniteTalk 版本、收費及 API 文件。

InfiniteTalk on RunAPI →

立即在 OpenClaw 中試用 InfiniteTalk。

取得免費 RunAPI key,將 prompt 貼入 OpenClaw,從任何音訊檔案生成對嘴同步的對嘴說話虛擬人物影片。