HERMES + INFINITETALK

在 Hermes Agent 中使用 InfiniteTalk。

InfiniteTalk 根据音频文件和人脸图像生成口型同步的说话头像视频。Hermes Agent 通过 RunAPI custom 端点调用它——配置一次 custom:runapi,发送 audio_to_video,轮询获取完成的视频。

一个 API key · 音频转视频端点 · 异步任务轮询
Use RunAPI to generate a talking avatar video with InfiniteTalk.

Requirements:
- Read the API key from RUNAPI_API_KEY.
- Use the custom:runapi provider with base_url https://runapi.ai/v1.
- Call POST https://runapi.ai/api/v1/infinitetalk/audio_to_video
- Set model to "infinitetalk-from-audio".
- Set source_audio_url to the URL of the audio file.
- Set source_image_url to the URL of the face image.
- Set prompt to describe the desired output.
- The task is async. Poll the returned task_id until status is "completed".
- When done, read the video URL from the response output.
curl -X POST https://runapi.ai/api/v1/infinitetalk/audio_to_video \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "infinitetalk-from-audio",
    "source_audio_url": "https://example.com/speech.mp3",
    "source_image_url": "https://example.com/avatar.jpg",
    "prompt": "A professional presenter delivering a product overview"
  }'
{
  "task_id": "tsk_abc123",
  "status": "pending",
  "model": "infinitetalk-from-audio"
}
复制 curl 命令进行测试 infinitetalk
工作原理

三步在 Hermes Agent 中使用 InfiniteTalk

1

配置 RunAPI

在运行 Hermes Agent 的环境中设置 RUNAPI_API_KEY。如果你已经添加了 RunAPI 作为 custom:runapi provider,同一个 key 也可以处理 InfiniteTalk 请求。

export RUNAPI_API_KEY=runapi_xxx
2

调用 InfiniteTalk

向 audio_to_video 端点发送 POST 请求,包含 model、音频 URL、图像 URL 和描述输出的 prompt。Hermes Agent 可以通过 custom:runapi provider 构建并发送此请求。

POST /api/v1/infinitetalk/audio_to_video
3

轮询结果

端点立即返回 task_id。轮询任务状态端点,直到状态为 completed,然后从响应中读取输出视频 URL。

GET /api/v1/infinitetalk/audio_to_video/tsk_abc123
参数

InfiniteTalk API 参数

参数 类型 说明
model string 必填。使用 infinitetalk-from-audio。
source_audio_url string 必填。用于口型同步的源音频文件 URL。
source_image_url string 必填。用于动画化的人脸或头像图像 URL。
prompt string 必填。对所需视频输出的文字描述,最多 5000 个字符。
output_resolution string 可选。输出视频分辨率。可选值:480p、720p,默认 480p。
seed integer 可选。可复现性种子。10000 到 1000000 之间的整数。
callback_url string 可选。任务完成时接收 POST 的 webhook URL。

Hermes Agent 上的 InfiniteTalk 是什么?

InfiniteTalk 通过音频文件和参考图驱动面部动画、口型同步和头部运动,生成说话头像视频。Hermes Agent 通过 custom:runapi provider 调用它,可构建多步骤流水线——例如先用 ElevenLabs 生成语音,再将音频 URL 传给 InfiniteTalk,完成完整的文字转说话视频工作流。

InfiniteTalk 使用场景

AI 主播的 YouTube 内容

仅用一张照片为 YouTube 频道生成说话头像视频,无需出镜拍摄,同时保持所有视频中主播形象的一致性。

带口型同步的视频配音

对现有视频中的人脸进行重新动画化,使其与不同语言的新音轨匹配,生成口型与翻译语音同步的配音内容。

长篇讲座与演示视频

仅用一张讲师照片和录制的旁白,为在线课程、网络研讨会或内部培训制作不限时长的说话头像视频。

常见问题

InfiniteTalk + Hermes Agent 常见问题

Hermes Agent 通用配置

还没配置?从 Hermes Agent 的 RunAPI 配置指南开始。

Hermes Agent 配置指南 →

InfiniteTalk 模型目录

查看 InfiniteTalk 变体、价格和 API 文档。

RunAPI 上的 InfiniteTalk →

立即在 Hermes Agent 中试用 InfiniteTalk。

获取免费 RunAPI key,配置 custom:runapi provider,从任意音频文件生成口型同步的说话头像视频。