可以在 Hermes Agent 中使用 InfiniteTalk 吗？

可以。Hermes Agent 可以通过 custom:runapi provider 调用 RunAPI InfiniteTalk 端点。在环境中设置 RUNAPI_API_KEY，然后向 /api/v1/infinitetalk/audio_to_video 发送 POST 请求，包含 model、音频 URL 和图像 URL。

InfiniteTalk 需要单独的 API key 吗？

不需要。用于聊天、图像和视频生成的同一个 RUNAPI_API_KEY 也适用于 InfiniteTalk。所有 RunAPI 模型共享一个 key 和一个点数余额。

InfiniteTalk 是同步还是异步的？

异步。创建端点立即返回 task_id。轮询任务状态端点，或提供 callback_url 以在视频准备好时接收 webhook。

在 RunAPI 上使用 InfiniteTalk 的价格是多少？

InfiniteTalk 按任务计费。查看 RunAPI 定价页面获取最新价格。点数从所有 RunAPI 模型共用的同一余额中扣除。

HERMES + INFINITETALK

在 Hermes Agent 中使用 InfiniteTalk。

InfiniteTalk 根据音频文件和人脸图像生成口型同步的说话头像视频。Hermes Agent 通过 RunAPI custom 端点调用它——配置一次 custom:runapi，发送 audio_to_video，轮询获取完成的视频。

获取 API Key 阅读文档

一个 API key · 音频转视频端点 · 异步任务轮询

Use RunAPI to generate a talking avatar video with InfiniteTalk.

Requirements:
- Read the API key from RUNAPI_API_KEY.
- Use the custom:runapi provider with base_url https://runapi.ai/v1.
- Call POST https://runapi.ai/api/v1/infinitetalk/audio_to_video
- Set model to "infinitetalk-from-audio".
- Set source_audio_url to the URL of the audio file.
- Set source_image_url to the URL of the face image.
- Set prompt to describe the desired output.
- The task is async. Poll the returned task_id until status is "completed".
- When done, read the video URL from the response output.

curl -X POST https://runapi.ai/api/v1/infinitetalk/audio_to_video \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "infinitetalk-from-audio",
    "source_audio_url": "https://example.com/speech.mp3",
    "source_image_url": "https://example.com/avatar.jpg",
    "prompt": "A professional presenter delivering a product overview"
  }'

{
  "task_id": "tsk_abc123",
  "status": "pending",
  "model": "infinitetalk-from-audio"
}

复制 curl 命令进行测试 infinitetalk

工作原理

三步在 Hermes Agent 中使用 InfiniteTalk

配置 RunAPI

在运行 Hermes Agent 的环境中设置 RUNAPI_API_KEY。如果你已经添加了 RunAPI 作为 custom:runapi provider，同一个 key 也可以处理 InfiniteTalk 请求。

export RUNAPI_API_KEY=runapi_xxx

调用 InfiniteTalk

向 audio_to_video 端点发送 POST 请求，包含 model、音频 URL、图像 URL 和描述输出的 prompt。Hermes Agent 可以通过 custom:runapi provider 构建并发送此请求。

POST /api/v1/infinitetalk/audio_to_video

轮询结果

端点立即返回 task_id。轮询任务状态端点，直到状态为 completed，然后从响应中读取输出视频 URL。

GET /api/v1/infinitetalk/audio_to_video/tsk_abc123

参数

InfiniteTalk API 参数

参数	类型	说明
`model`	`string`	必填。使用 infinitetalk-from-audio。
`source_audio_url`	`string`	必填。用于口型同步的源音频文件 URL。
`source_image_url`	`string`	必填。用于动画化的人脸或头像图像 URL。
`prompt`	`string`	必填。对所需视频输出的文字描述，最多 5000 个字符。
`output_resolution`	`string`	可选。输出视频分辨率。可选值：480p、720p，默认 480p。
`seed`	`integer`	可选。可复现性种子。10000 到 1000000 之间的整数。
`callback_url`	`string`	可选。任务完成时接收 POST 的 webhook URL。

Hermes Agent 上的 InfiniteTalk 是什么？

InfiniteTalk 通过音频文件和参考图驱动面部动画、口型同步和头部运动，生成说话头像视频。Hermes Agent 通过 custom:runapi provider 调用它，可构建多步骤流水线——例如先用 ElevenLabs 生成语音，再将音频 URL 传给 InfiniteTalk，完成完整的文字转说话视频工作流。