我可以從 OpenClaw 使用哪些 ElevenLabs 端點？

RunAPI 提供六個 ElevenLabs 端點：text_to_speech（turbo-v2.5 和 multilingual-v2）、text_to_dialogue（dialogue-v3 多說話者）、text_to_sound（音效）、speech_to_text（轉錄）和 isolate_audio（人聲擷取）。全部共用相同的 RUNAPI_API_KEY。

turbo-v2.5 和 multilingual-v2 有什麼差別？

turbo-v2.5 針對低延遲和英語優先輸出進行最佳化 — 未指定語音時會套用預設語音。multilingual-v2 支援 29 種語言，需要明確的 voice ID 和選填的 language_code。turbo 的每字元費用約為一半。

ElevenLabs 文字轉語音在 RunAPI 上是同步還是非同步的？

非同步。建立端點會立即回傳 task_id。輪詢任務狀態端點或提供 callback_url 以在音訊檔案準備就緒時接收 webhook。

ElevenLabs 在 RunAPI 上如何計費？

文字轉語音和對話端點按輸入文字的字元數計費。語音轉文字按音訊分鐘數計費。音訊分離按任務計費。請查看 RunAPI 定價頁面了解目前費率。

我可以在 OpenClaw 中使用 ElevenLabs dialogue-v3 生成多說話者音訊嗎？

可以。呼叫 text_to_dialogue 端點並將 model 設為 text-to-dialogue-v3。傳入 dialogue 陣列，每個項目包含 text 和 voice ID。所有說話者的文字總計不得超過 5000 個字元。

OPENCLAW + ELEVENLABS

在 OpenClaw 中使用 ElevenLabs。

ElevenLabs 透過 RunAPI 提供六個音訊端點 — turbo-v2.5 文字轉語音（亞秒級延遲）、multilingual-v2（支援 29 種語言）、dialogue-v3（多說話者對話）、音效、語音轉文字轉錄和人聲分離。OpenClaw agent 使用與聊天相同的 RunAPI key 來呼叫任一端點。

取得 API Key 閱讀說明文件

一個 API key · 文字轉語音端點 · 按字元計費

Use RunAPI to generate speech audio with ElevenLabs text-to-speech.

Requirements:
- Read the API key from RUNAPI_API_KEY.
- Call POST https://runapi.ai/api/v1/elevenlabs/text_to_speech
- Set model to "text-to-speech-turbo-v2.5".
- Set text to the content you want spoken.
- Optionally set voice to a specific ElevenLabs voice ID.
- Optionally set speed between 0.7 and 1.2.
- The task is async. Poll the returned task_id until status is "completed".
- When done, read the audio URL from the response output.

curl -X POST https://runapi.ai/api/v1/elevenlabs/text_to_speech \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "text-to-speech-turbo-v2.5",
    "text": "Welcome to RunAPI. This audio was generated by ElevenLabs turbo v2.5.",
    "speed": 1.0,
    "stability": 0.5,
    "similarity_boost": 0.75
  }'

{
  "task_id": "tsk_abc123",
  "status": "pending",
  "model": "text-to-speech-turbo-v2.5"
}

複製 curl 指令進行測試 elevenlabs

運作原理

三步驟在 OpenClaw 中使用 ElevenLabs

設定 RunAPI

在環境中設定 RUNAPI_API_KEY。如果你已在 OpenClaw 中設定 RunAPI 用於聊天，同一組 key 即可用於所有 ElevenLabs 端點 — 文字轉語音、語音轉文字、對話、音效和音訊分離。

export RUNAPI_API_KEY=runapi_xxx

呼叫 text_to_speech

向 text_to_speech 端點發送 POST 請求，將 model 設為 text-to-speech-turbo-v2.5，附上要朗讀的文字，以及選填的 voice、speed 和 stability 參數。如需多語言輸出，使用 text-to-speech-multilingual-v2 並搭配 voice 和 language_code。

POST /api/v1/elevenlabs/text_to_speech

輪詢結果

端點會立即回傳 task_id。輪詢任務狀態端點，直到 status 為 completed，然後從回應中讀取輸出音訊 URL。

GET /api/v1/elevenlabs/text_to_speech/tsk_abc123

參數

ElevenLabs text_to_speech API 參數

參數	類型	說明
`model`	`string`	必填。text-to-speech-turbo-v2.5（低延遲）或 text-to-speech-multilingual-v2（29 種語言）。
`text`	`string`	必填。要轉換為語音的文字。最多 5000 個字元。
`voice`	`string`	ElevenLabs voice ID。multilingual-v2 必填。turbo-v2.5 若省略則使用預設語音。
`speed`	`float`	選填。播放速度倍率。範圍 0.7 到 1.2。
`stability`	`float`	選填。語音一致性。範圍 0.0 到 1.0。較低值增加表現力。
`similarity_boost`	`float`	選填。語音相似度強化。範圍 0.0 到 1.0。
`style`	`float`	選填。風格誇張程度。範圍 0.0 到 1.0。
`language_code`	`string`	選填。multilingual-v2 的目標語言，例如 en、es、ja。
`callback_url`	`string`	選填。任務完成時接收 POST 通知的 Webhook URL。

OpenClaw 上的 ElevenLabs 是什麼？

ElevenLabs 是自然語音輸出的首選文字轉語音 API。透過 RunAPI，OpenClaw 代理可存取 turbo-v2.5（英語次秒延遲）、multilingual-v2（29 種語言）、dialogue-v3（多說話者對話）、音效生成、語音轉文字轉錄和人聲分離功能。你可以透過穩定度和相似度增強滑桿調整語音輸出，控制聲音的表現力或一致性。