OPENCLAW + INFINITETALK

在 OpenClaw 中使用 InfiniteTalk。

InfiniteTalk 根据音频文件和人脸图像生成口型同步的说话头像视频。OpenClaw agent 通过 RunAPI 使用与聊天相同的 API key 调用它——发送 audio_to_video,轮询任务,接收视频 URL。

一个 API key · 音频转视频端点 · 异步任务轮询
Use RunAPI to generate a talking avatar video with InfiniteTalk.

Requirements:
- Read the API key from RUNAPI_API_KEY.
- Call POST https://runapi.ai/api/v1/infinitetalk/audio_to_video
- Set model to "infinitetalk-from-audio".
- Set source_audio_url to the URL of the audio file.
- Set source_image_url to the URL of the face image.
- Set prompt to describe the desired output.
- The task is async. Poll the returned task_id until status is "completed".
- When done, read the video URL from the response output.
curl -X POST https://runapi.ai/api/v1/infinitetalk/audio_to_video \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "infinitetalk-from-audio",
    "source_audio_url": "https://example.com/speech.mp3",
    "source_image_url": "https://example.com/avatar.jpg",
    "prompt": "A professional presenter delivering a product overview"
  }'
{
  "task_id": "tsk_abc123",
  "status": "pending",
  "model": "infinitetalk-from-audio"
}
复制 curl 命令进行测试 infinitetalk
工作原理

三步在 OpenClaw 中使用 InfiniteTalk

1

配置 RunAPI

在环境中设置 RUNAPI_API_KEY。如果你已经在 OpenClaw 中为聊天配置了 RunAPI,同一个 key 也适用于 InfiniteTalk,无需额外 provider 配置。

export RUNAPI_API_KEY=runapi_xxx
2

调用 InfiniteTalk

向 audio_to_video 端点发送 POST 请求,包含 model、音频 URL、图像 URL 和描述输出的 prompt。OpenClaw 可以在你的 agent 工作流中构建并发送此请求。

POST /api/v1/infinitetalk/audio_to_video
3

轮询结果

端点立即返回 task_id。轮询任务状态端点,直到状态为 completed,然后从响应中读取输出视频 URL。

GET /api/v1/infinitetalk/audio_to_video/tsk_abc123
参数

InfiniteTalk API 参数

参数 类型 说明
model string 必填。使用 infinitetalk-from-audio。
source_audio_url string 必填。用于口型同步的源音频文件 URL。
source_image_url string 必填。用于动画化的人脸或头像图像 URL。
prompt string 必填。对所需视频输出的文字描述,最多 5000 个字符。
output_resolution string 可选。输出视频分辨率。可选值:480p、720p,默认 480p。
seed integer 可选。可复现性种子。10000 到 1000000 之间的整数。
callback_url string 可选。任务完成时接收 POST 的 webhook URL。

OpenClaw 上的 InfiniteTalk 是什么?

InfiniteTalk 是一个音频驱动的说话头像模型,将一张照片和一段音频合成为带有头部动作、面部表情和肢体姿态的口型同步视频。OpenClaw agent 通过 RunAPI 调用它,无需摄影设备或动作捕捉装备即可生成不限时长的说话头像视频。

InfiniteTalk 使用场景

播客转视频

将播客音频和主播照片输入,生成说话头像视频,把纯音频节目转化为适合 YouTube 或社交媒体的视频内容。

教学与教程视频

仅用一张讲师照片和录制的讲解音频,制作讲座或教程视频,无需摄像机即可产出长篇说话头像内容。

营销数字代言人

从一张参考图生成品牌数字发言人,通过更换音轨即可批量生成多语言版本的代言视频。

常见问题

InfiniteTalk + OpenClaw 常见问题

OpenClaw 通用配置

还没配置?从 OpenClaw 的 RunAPI 配置指南开始。

OpenClaw 配置指南 →

InfiniteTalk 模型目录

查看 InfiniteTalk 变体、价格和 API 文档。

RunAPI 上的 InfiniteTalk →

立即在 OpenClaw 中试用 InfiniteTalk。

获取免费 RunAPI key,将 prompt 粘贴到 OpenClaw,从任意音频文件生成口型同步的说话头像视频。