ElevenLabs in OpenClaw verwenden.
ElevenLabs bietet sechs Audio-Endpunkte über RunAPI — turbo-v2.5 TTS mit unter einer Sekunde Latenz, multilingual-v2 für 29 Sprachen, dialogue-v3 für Multi-Speaker-Konversationen, Soundeffekte, Sprache-zu-Text-Transkription und Vokaltrennung. OpenClaw-Agenten rufen jeden davon mit demselben RunAPI-Key wie für Chat auf.
RunAPI verwenden, um Sprachaudio mit ElevenLabs Text-to-Speech zu generieren.
Requirements:
- Read the API key from RUNAPI_API_KEY.
- Call POST https://runapi.ai/api/v1/elevenlabs/text_to_speech
- Set model to "text-to-speech-turbo-v2.5".
- Set text to the content you want spoken.
- Optionally set voice to a specific ElevenLabs voice ID.
- Optionally set speed between 0.7 and 1.2.
- The task is async. Poll the returned task_id until status is "completed".
- When done, read the audio URL from the response output.
curl -X POST https://runapi.ai/api/v1/elevenlabs/text_to_speech \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "text-to-speech-turbo-v2.5",
"text": "Welcome to RunAPI. This audio was generated by ElevenLabs turbo v2.5.",
"speed": 1.0,
"stability": 0.5,
"similarity_boost": 0.75
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "text-to-speech-turbo-v2.5"
}
ElevenLabs in OpenClaw in drei Schritten verwenden
RunAPI konfigurieren
RUNAPI_API_KEY in der Umgebung setzen. Wenn RunAPI bereits für Chat in OpenClaw konfiguriert ist, funktioniert derselbe Key für alle ElevenLabs-Endpunkte — TTS, STT, Dialogue, Soundeffekte und Audio-Isolation.
export RUNAPI_API_KEY=runapi_xxx
text_to_speech aufrufen
Einen POST an den text_to_speech-Endpunkt mit model text-to-speech-turbo-v2.5, dem zu sprechenden Text und optionalen voice-, speed- und stability-Parametern senden. Für mehrsprachigen Output text-to-speech-multilingual-v2 mit einer voice und language_code verwenden.
POST /api/v1/elevenlabs/text_to_speech
Ergebnis abrufen
Der Endpunkt gibt sofort eine task_id zurück. Den Task-Status-Endpunkt abfragen, bis der Status completed ist, dann die Audio-URL aus der Antwort auslesen.
GET /api/v1/elevenlabs/text_to_speech/tsk_abc123
ElevenLabs text_to_speech API-Parameter
| Parameter | Typ | Beschreibung |
|---|---|---|
model |
string |
Erforderlich. text-to-speech-turbo-v2.5 (niedrige Latenz) oder text-to-speech-multilingual-v2 (29 Sprachen). |
text |
string |
Erforderlich. Der zu sprechende Text. Maximal 5000 Zeichen. |
voice |
string |
ElevenLabs-Stimm-ID. Erforderlich für multilingual-v2. Turbo-v2.5 verwendet eine Standardstimme, wenn weggelassen. |
speed |
float |
Optional. Wiedergabegeschwindigkeitsmultiplikator. Bereich 0,7 bis 1,2. |
stability |
float |
Optional. Stimmkonsistenz. Bereich 0,0 bis 1,0. Niedrigere Werte fügen Ausdrucksstärke hinzu. |
similarity_boost |
float |
Optional. Stimmähnlichkeitserzwingung. Bereich 0,0 bis 1,0. |
style |
float |
Optional. Stilübertreibung. Bereich 0,0 bis 1,0. |
language_code |
string |
Optional. Zielsprache für multilingual-v2, z. B. en, es, ja. |
callback_url |
string |
Optional. Webhook-URL, die einen POST erhält, wenn der Task abgeschlossen ist. |
Was ist ElevenLabs auf OpenClaw?
ElevenLabs ist die bevorzugte Text-zu-Sprache-API für natürlich klingende Sprachausgabe. Über RunAPI erhalten OpenClaw-Agenten Zugriff auf turbo-v2.5 (Subsekunden-Latenz für Englisch), multilingual-v2 (29 Sprachen), dialogue-v3 (Mehrsprechergespräche), Soundeffektgenerierung, Sprache-zu-Text-Transkription und Vokal-Isolierung. Die Sprachausgabe kann mit Stabilitäts- und Ähnlichkeits-Boost-Reglern angepasst werden, um zu steuern, wie ausdrucksstark oder konsistent die Stimme klingt.
ElevenLabs Anwendungsfälle
Hörbuch- und Podcast-Narration
Langtext in gesprochenes Audio mit konsistenten Charakterstimmen umwandeln. Stabilität für Sprecher-Konsistenz anpassen und Ähnlichkeits-Boost, um die Stimme über Stunden von Content nah am ursprünglichen Profil zu halten.
Video-Synchronisation in mehrere Sprachen
Video-Content in 29 Sprachen mit multilingual-v2 mit demselben Stimmenprofil synchronisieren und lokalisierte Versionen produzieren, die die ursprünglichen Sprachcharakteristiken des Sprechers beibehalten.
Soundeffekte für Video- und Spielproduktion
Benutzerdefinierte Foley-Sounds, Ambient-Audio und Soundcues aus Textbeschreibungen über den text_to_sound-Endpunkt generieren und Stichproben-Audio-Bibliothekssuchen durch On-Demand-Generierung ersetzen.
ElevenLabs + OpenClaw — Fragen
RunAPI stellt sechs ElevenLabs-Endpunkte bereit: text_to_speech (turbo-v2.5 und multilingual-v2), text_to_dialogue (dialogue-v3 für Multi-Speaker), text_to_sound (Soundeffekte), speech_to_text (Transkription) und isolate_audio (Vokaltrennung). Alle teilen denselben RUNAPI_API_KEY.
Turbo-v2.5 ist für niedrige Latenz und englischsprachigen Output optimiert — es wird eine Standardstimme angewendet, wenn keine angegeben ist. Multilingual-v2 unterstützt 29 Sprachen und benötigt eine explizite voice-ID und optionalen language_code. Turbo kostet etwa halb so viel pro Zeichen.
Asynchron. Der Create-Endpunkt gibt sofort eine task_id zurück. Den Task-Status-Endpunkt abfragen oder callback_url angeben, um einen Webhook zu erhalten, wenn die Audiodatei zum Download bereit ist.
Text-to-Speech- und Dialogue-Endpunkte werden pro Zeichen des Eingabetexts abgerechnet. Speech-to-Text wird pro Audiominute abgerechnet. Audio-Isolation wird pro Task abgerechnet. Aktuelle Preise auf der RunAPI-Preisseite.
Ja. Den text_to_dialogue-Endpunkt mit model text-to-dialogue-v3 aufrufen. Ein dialogue-Array übergeben, in dem jedes Element einen text und eine voice-ID hat. Der Gesamttext über alle Sprecher muss unter 5000 Zeichen liegen.
OpenClaw Grundeinrichtung
Noch nicht eingerichtet? Mit der RunAPI-Einrichtungsanleitung für OpenClaw starten.
OpenClaw Einrichtungsanleitung →ElevenLabs Modellkatalog
Alle ElevenLabs-Varianten, Preise und API-Dokumentation ansehen.
ElevenLabs on RunAPI →ElevenLabs in OpenClaw noch heute ausprobieren.
Einen kostenlosen RunAPI-Key holen, den Prompt in OpenClaw einfügen und Sprachaudio mit ElevenLabs generieren — sechs Endpunkte, ein API-Key, zeichenbasierte Abrechnung.