在 Hermes Agent 中使用 InfiniteTalk。
InfiniteTalk 根据音频文件和人脸图像生成口型同步的说话头像视频。Hermes Agent 通过 RunAPI custom 端点调用它——配置一次 custom:runapi,发送 audio_to_video,轮询获取完成的视频。
Use RunAPI to generate a talking avatar video with InfiniteTalk.
Requirements:
- Read the API key from RUNAPI_API_KEY.
- Use the custom:runapi provider with base_url https://runapi.ai/v1.
- Call POST https://runapi.ai/api/v1/infinitetalk/audio_to_video
- Set model to "infinitetalk-from-audio".
- Set source_audio_url to the URL of the audio file.
- Set source_image_url to the URL of the face image.
- Set prompt to describe the desired output.
- The task is async. Poll the returned task_id until status is "completed".
- When done, read the video URL from the response output.
curl -X POST https://runapi.ai/api/v1/infinitetalk/audio_to_video \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "infinitetalk-from-audio",
"source_audio_url": "https://example.com/speech.mp3",
"source_image_url": "https://example.com/avatar.jpg",
"prompt": "A professional presenter delivering a product overview"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "infinitetalk-from-audio"
}
三步在 Hermes Agent 中使用 InfiniteTalk
配置 RunAPI
在运行 Hermes Agent 的环境中设置 RUNAPI_API_KEY。如果你已经添加了 RunAPI 作为 custom:runapi provider,同一个 key 也可以处理 InfiniteTalk 请求。
export RUNAPI_API_KEY=runapi_xxx
调用 InfiniteTalk
向 audio_to_video 端点发送 POST 请求,包含 model、音频 URL、图像 URL 和描述输出的 prompt。Hermes Agent 可以通过 custom:runapi provider 构建并发送此请求。
POST /api/v1/infinitetalk/audio_to_video
轮询结果
端点立即返回 task_id。轮询任务状态端点,直到状态为 completed,然后从响应中读取输出视频 URL。
GET /api/v1/infinitetalk/audio_to_video/tsk_abc123
InfiniteTalk API 参数
| 参数 | 类型 | 说明 |
|---|---|---|
model |
string |
必填。使用 infinitetalk-from-audio。 |
source_audio_url |
string |
必填。用于口型同步的源音频文件 URL。 |
source_image_url |
string |
必填。用于动画化的人脸或头像图像 URL。 |
prompt |
string |
必填。对所需视频输出的文字描述,最多 5000 个字符。 |
output_resolution |
string |
可选。输出视频分辨率。可选值:480p、720p,默认 480p。 |
seed |
integer |
可选。可复现性种子。10000 到 1000000 之间的整数。 |
callback_url |
string |
可选。任务完成时接收 POST 的 webhook URL。 |
Hermes Agent 上的 InfiniteTalk 是什么?
InfiniteTalk 通过音频文件和参考图驱动面部动画、口型同步和头部运动,生成说话头像视频。Hermes Agent 通过 custom:runapi provider 调用它,可构建多步骤流水线——例如先用 ElevenLabs 生成语音,再将音频 URL 传给 InfiniteTalk,完成完整的文字转说话视频工作流。
InfiniteTalk 使用场景
AI 主播的 YouTube 内容
仅用一张照片为 YouTube 频道生成说话头像视频,无需出镜拍摄,同时保持所有视频中主播形象的一致性。
带口型同步的视频配音
对现有视频中的人脸进行重新动画化,使其与不同语言的新音轨匹配,生成口型与翻译语音同步的配音内容。
长篇讲座与演示视频
仅用一张讲师照片和录制的旁白,为在线课程、网络研讨会或内部培训制作不限时长的说话头像视频。
InfiniteTalk + Hermes Agent 常见问题
可以。Hermes Agent 可以通过 custom:runapi provider 调用 RunAPI InfiniteTalk 端点。在环境中设置 RUNAPI_API_KEY,然后向 /api/v1/infinitetalk/audio_to_video 发送 POST 请求,包含 model、音频 URL 和图像 URL。
不需要。用于聊天、图像和视频生成的同一个 RUNAPI_API_KEY 也适用于 InfiniteTalk。所有 RunAPI 模型共享一个 key 和一个点数余额。
异步。创建端点立即返回 task_id。轮询任务状态端点,或提供 callback_url 以在视频准备好时接收 webhook。
InfiniteTalk 按任务计费。查看 RunAPI 定价页面获取最新价格。点数从所有 RunAPI 模型共用的同一余额中扣除。
立即在 Hermes Agent 中试用 InfiniteTalk。
获取免费 RunAPI key,配置 custom:runapi provider,从任意音频文件生成口型同步的说话头像视频。