在 OpenClaw 中使用 InfiniteTalk。
InfiniteTalk 根据音频文件和人脸图像生成口型同步的说话头像视频。OpenClaw agent 通过 RunAPI 使用与聊天相同的 API key 调用它——发送 audio_to_video,轮询任务,接收视频 URL。
Use RunAPI to generate a talking avatar video with InfiniteTalk.
Requirements:
- Read the API key from RUNAPI_API_KEY.
- Call POST https://runapi.ai/api/v1/infinitetalk/audio_to_video
- Set model to "infinitetalk-from-audio".
- Set source_audio_url to the URL of the audio file.
- Set source_image_url to the URL of the face image.
- Set prompt to describe the desired output.
- The task is async. Poll the returned task_id until status is "completed".
- When done, read the video URL from the response output.
curl -X POST https://runapi.ai/api/v1/infinitetalk/audio_to_video \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "infinitetalk-from-audio",
"source_audio_url": "https://example.com/speech.mp3",
"source_image_url": "https://example.com/avatar.jpg",
"prompt": "A professional presenter delivering a product overview"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "infinitetalk-from-audio"
}
三步在 OpenClaw 中使用 InfiniteTalk
配置 RunAPI
在环境中设置 RUNAPI_API_KEY。如果你已经在 OpenClaw 中为聊天配置了 RunAPI,同一个 key 也适用于 InfiniteTalk,无需额外 provider 配置。
export RUNAPI_API_KEY=runapi_xxx
调用 InfiniteTalk
向 audio_to_video 端点发送 POST 请求,包含 model、音频 URL、图像 URL 和描述输出的 prompt。OpenClaw 可以在你的 agent 工作流中构建并发送此请求。
POST /api/v1/infinitetalk/audio_to_video
轮询结果
端点立即返回 task_id。轮询任务状态端点,直到状态为 completed,然后从响应中读取输出视频 URL。
GET /api/v1/infinitetalk/audio_to_video/tsk_abc123
InfiniteTalk API 参数
| 参数 | 类型 | 说明 |
|---|---|---|
model |
string |
必填。使用 infinitetalk-from-audio。 |
source_audio_url |
string |
必填。用于口型同步的源音频文件 URL。 |
source_image_url |
string |
必填。用于动画化的人脸或头像图像 URL。 |
prompt |
string |
必填。对所需视频输出的文字描述,最多 5000 个字符。 |
output_resolution |
string |
可选。输出视频分辨率。可选值:480p、720p,默认 480p。 |
seed |
integer |
可选。可复现性种子。10000 到 1000000 之间的整数。 |
callback_url |
string |
可选。任务完成时接收 POST 的 webhook URL。 |
OpenClaw 上的 InfiniteTalk 是什么?
InfiniteTalk 是一个音频驱动的说话头像模型,将一张照片和一段音频合成为带有头部动作、面部表情和肢体姿态的口型同步视频。OpenClaw agent 通过 RunAPI 调用它,无需摄影设备或动作捕捉装备即可生成不限时长的说话头像视频。
InfiniteTalk 使用场景
播客转视频
将播客音频和主播照片输入,生成说话头像视频,把纯音频节目转化为适合 YouTube 或社交媒体的视频内容。
教学与教程视频
仅用一张讲师照片和录制的讲解音频,制作讲座或教程视频,无需摄像机即可产出长篇说话头像内容。
营销数字代言人
从一张参考图生成品牌数字发言人,通过更换音轨即可批量生成多语言版本的代言视频。
InfiniteTalk + OpenClaw 常见问题
可以。OpenClaw agent 可以直接调用 RunAPI InfiniteTalk 端点。使用你的 RUNAPI_API_KEY 将 RunAPI 配置为 provider,然后向 /api/v1/infinitetalk/audio_to_video 发送 POST 请求,包含 model、音频 URL 和图像 URL。
不需要。用于聊天、图像和视频生成的同一个 RUNAPI_API_KEY 也适用于 InfiniteTalk。所有 RunAPI 模型共享一个 key 和一个点数余额。
异步。创建端点立即返回 task_id。轮询任务状态端点,或提供 callback_url 以在视频准备好时接收 webhook。
InfiniteTalk 按任务计费。查看 RunAPI 定价页面获取最新价格。点数从所有 RunAPI 模型共用的同一余额中扣除。