HERMES + ELEVENLABS

在 Hermes Agent 中使用 ElevenLabs。

ElevenLabs 透過 RunAPI 提供六個音訊端點 — turbo-v2.5 文字轉語音(亞秒級延遲)、multilingual-v2(支援 29 種語言)、dialogue-v3(多說話者對話)、音效、語音轉文字轉錄和人聲分離。Hermes Agent 透過 custom:runapi provider 以一個 API key 來呼叫。

一個 API key · 文字轉語音端點 · 按字元計費
Use RunAPI to generate speech audio with ElevenLabs text-to-speech.

Requirements:
- Read the API key from RUNAPI_API_KEY.
- Use the custom:runapi provider with base_url https://runapi.ai/v1.
- Call POST https://runapi.ai/api/v1/elevenlabs/text_to_speech
- Set model to "text-to-speech-turbo-v2.5".
- Set text to the content you want spoken.
- Optionally set voice to a specific ElevenLabs voice ID.
- Optionally set speed between 0.7 and 1.2.
- The task is async. Poll the returned task_id until status is "completed".
- When done, read the audio URL from the response output.
curl -X POST https://runapi.ai/api/v1/elevenlabs/text_to_speech \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "text-to-speech-turbo-v2.5",
    "text": "Welcome to RunAPI. This audio was generated by ElevenLabs turbo v2.5.",
    "speed": 1.0,
    "stability": 0.5,
    "similarity_boost": 0.75
  }'
{
  "task_id": "tsk_abc123",
  "status": "pending",
  "model": "text-to-speech-turbo-v2.5"
}
複製 curl 指令進行測試 elevenlabs
運作原理

三步驟在 Hermes Agent 中使用 ElevenLabs

1

設定 RunAPI

在 Hermes Agent 執行環境中設定 RUNAPI_API_KEY。如果你已將 RunAPI 新增為 custom:runapi provider,同一組 key 和 base_url 即可處理所有 ElevenLabs 端點 — 文字轉語音、語音轉文字、對話、音效和音訊分離。

export RUNAPI_API_KEY=runapi_xxx
2

呼叫 text_to_speech

向 text_to_speech 端點發送 POST 請求,將 model 設為 text-to-speech-turbo-v2.5,附上要朗讀的文字,以及選填的 voice、speed 和 stability 參數。Hermes Agent 透過 custom:runapi provider 路由請求。如需多語言輸出,使用 text-to-speech-multilingual-v2 並搭配 voice 和 language_code。

POST /api/v1/elevenlabs/text_to_speech
3

輪詢結果

端點會立即回傳 task_id。輪詢任務狀態端點,直到 status 為 completed,然後從回應中讀取輸出音訊 URL。

GET /api/v1/elevenlabs/text_to_speech/tsk_abc123
參數

ElevenLabs text_to_speech API 參數

參數 類型 說明
model string 必填。text-to-speech-turbo-v2.5(低延遲)或 text-to-speech-multilingual-v2(29 種語言)。
text string 必填。要轉換為語音的文字。最多 5000 個字元。
voice string ElevenLabs voice ID。multilingual-v2 必填。turbo-v2.5 若省略則使用預設語音。
speed float 選填。播放速度倍率。範圍 0.7 到 1.2。
stability float 選填。語音一致性。範圍 0.0 到 1.0。較低值增加表現力。
similarity_boost float 選填。語音相似度強化。範圍 0.0 到 1.0。
style float 選填。風格誇張程度。範圍 0.0 到 1.0。
language_code string 選填。multilingual-v2 的目標語言,例如 en、es、ja。
callback_url string 選填。任務完成時接收 POST 通知的 Webhook URL。

Hermes Agent 上的 ElevenLabs 是什麼?

ElevenLabs 是領先的文本轉語音 API,Hermes Agent 通過 custom:runapi provider 呼叫它,用於語音生成、轉錄和音頻處理。在 Hermes 中的核心優勢是串聯——生成語音後,將音頻 URL 傳給 InfiniteTalk 製作説話頭像,或傳給影片模型完成完整視聽內容,全部在單次 agent 運行中完成。

ElevenLabs 使用場景

對話式 AI 語音助手

通過 turbo-v2.5 的亞秒級延遲生成自然語音,構建會説話的語音 agent,適用於客服機器人、交互式助手或電話端界面。

YouTube 內容旁白

以一致的角色聲音為 YouTube 影片製作配音,在整個系列中調節穩定性保持旁白一致,調節風格誇張度控制情感範圍。

文字轉説話影片工作流程

在 Hermes Agent 工作流中將 ElevenLabs TTS 與 InfiniteTalk 或其他影片模型串聯,在單次自動化運行中完成從文字到帶説話頭像旁白影片的全流程。

FAQ

ElevenLabs + Hermes Agent 常見問題

Hermes Agent 通用設定

尚未設定?請從 Hermes Agent 的 RunAPI 設定指南開始。

Hermes Agent 設定指南 →

ElevenLabs 模型目錄

查看所有 ElevenLabs 版本、定價和 API 文件。

ElevenLabs on RunAPI →

立即在 Hermes Agent 中試用 ElevenLabs。

取得免費 RunAPI key,設定 custom:runapi provider,即可使用 ElevenLabs 生成語音 — 六個端點、一個 API key、按字元計費。