Hermes Agent で InfiniteTalk を使う。
InfiniteTalk は音声ファイルと顔画像からリップシンクされたトーキングアバター動画を生成します。Hermes Agent は RunAPI カスタムエンドポイントを通じて呼び出します。custom:runapi を一度設定すれば、audio_to_video を送って完成した動画をポーリングするだけです。
Use RunAPI to generate a talking avatar video with InfiniteTalk.
Requirements:
- Read the API key from RUNAPI_API_KEY.
- Use the custom:runapi provider with base_url https://runapi.ai/v1.
- Call POST https://runapi.ai/api/v1/infinitetalk/audio_to_video
- Set model to "infinitetalk-from-audio".
- Set source_audio_url to the URL of the audio file.
- Set source_image_url to the URL of the face image.
- Set prompt to describe the desired output.
- The task is async. Poll the returned task_id until status is "completed".
- When done, read the video URL from the response output.
curl -X POST https://runapi.ai/api/v1/infinitetalk/audio_to_video \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "infinitetalk-from-audio",
"source_audio_url": "https://example.com/speech.mp3",
"source_image_url": "https://example.com/avatar.jpg",
"prompt": "A professional presenter delivering a product overview"
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "infinitetalk-from-audio"
}
3 ステップで Hermes Agent で InfiniteTalk を使う
RunAPI を設定する
Hermes Agent が実行される環境に RUNAPI_API_KEY を設定します。すでに RunAPI を custom:runapi プロバイダーとして追加済みであれば、同じキーで InfiniteTalk リクエストを処理できます。
export RUNAPI_API_KEY=runapi_xxx
InfiniteTalk を呼び出す
model、音声 URL、画像 URL、出力を説明するプロンプトを指定して audio_to_video エンドポイントに POST リクエストを送ります。Hermes Agent は custom:runapi プロバイダーを通じてこのリクエストをビルドして送信できます。
POST /api/v1/infinitetalk/audio_to_video
結果をポーリングする
エンドポイントは即座に task_id を返します。ステータスが completed になるまでタスクステータスエンドポイントをポーリングし、レスポンスから出力動画 URL を読み取ります。
GET /api/v1/infinitetalk/audio_to_video/tsk_abc123
InfiniteTalk API パラメーター
| パラメータ | 型 | 説明 |
|---|---|---|
model |
string |
必須。infinitetalk-from-audio を使用します。 |
source_audio_url |
string |
必須。リップシンクするソース音声ファイルの URL。 |
source_image_url |
string |
必須。アニメーションする顔またはアバター画像の URL。 |
prompt |
string |
必須。生成したい動画出力のテキスト説明。最大 5000 文字。 |
output_resolution |
string |
省略可。出力動画の解像度。指定可能な値:480p、720p。デフォルトは 480p。 |
seed |
integer |
省略可。再現性シード。10000 から 1000000 の整数。 |
callback_url |
string |
省略可。タスク完了時に POST を受け取る webhook URL。 |
Hermes AgentのInfiniteTalkとは?
InfiniteTalkは、音声ファイルと参照画像から顔のアニメーション・口パク・頭部の動きを駆動してトーキングアバター動画を生成します。Hermes Agentはcustom:runapi provider経由で呼び出し、複数ステップのパイプラインを構築できます。たとえばElevenLabsで音声を生成し、そのURLをInfiniteTalkに渡すことでテキストから完全なトーキング動画ワークフローを実現します。
InfiniteTalkの活用例
AIプレゼンターによるYouTubeコンテンツ
写真1枚でYouTubeチャンネル向けのトーキングヘッド動画を生成し、カメラ出演なしに全動画で一貫したプレゼンターを維持します。
口パク同期による動画吹き替え
既存動画の顔を再アニメーション化して別言語の新しい音声に合わせ、口の動きが翻訳音声に同期した吹き替えコンテンツを制作します。
長尺講義・プレゼン動画
講師の写真1枚と録音したナレーションだけで、オンライン講座・ウェビナー・社内研修向けの無制限の長さのトーキングアバター動画を作成します。
InfiniteTalk + Hermes Agent よくある質問
はい。Hermes Agent は custom:runapi プロバイダーを通じて RunAPI の InfiniteTalk エンドポイントを呼び出せます。環境変数に RUNAPI_API_KEY を設定し、model、音声 URL、画像 URL を指定して /api/v1/infinitetalk/audio_to_video に POST します。
いいえ。チャット、画像、動画生成に使用している RUNAPI_API_KEY が InfiniteTalk でもそのまま使えます。すべての RunAPI モデルは 1 つのキーと 1 つのクレジット残高を共有します。
非同期です。作成エンドポイントは即座に task_id を返します。タスクステータスエンドポイントをポーリングするか、callback_url を提供して動画の準備ができたときに webhook を受け取ります。
InfiniteTalk はタスクごとの課金です。現在の料金は RunAPI 料金ページで確認してください。クレジットはすべての RunAPI モデルで共有する残高から差し引かれます。
Hermes Agent 全般セットアップ
まだ設定していませんか?Hermes Agent の RunAPI セットアップガイドから始めてください。
Hermes Agent セットアップガイド →今すぐ Hermes Agent で InfiniteTalk を試す。
無料の RunAPI キーを取得し、custom:runapi プロバイダーを設定して、任意の音声ファイルからリップシンクされたトーキングアバター動画を生成しましょう。