Używaj ElevenLabs w OpenClaw.
ElevenLabs zapewnia sześć endpointów audio przez RunAPI — TTS turbo-v2.5 z opóźnieniem poniżej sekundy, multilingual-v2 obsługujący 29 języków, dialogue-v3 dla rozmów wieloosobowych, efekty džwiękowe, transkrypcję mowy na tekst i izolację wokalu. Agenty OpenClaw wywołują je tym samym kluczem RunAPI używanym do czatu.
Use RunAPI to generate speech audio with ElevenLabs text-to-speech.
Requirements:
- Read the API key from RUNAPI_API_KEY.
- Call POST https://runapi.ai/api/v1/elevenlabs/text_to_speech
- Set model to "text-to-speech-turbo-v2.5".
- Set text to the content you want spoken.
- Optionally set voice to a specific ElevenLabs voice ID.
- Optionally set speed between 0.7 and 1.2.
- The task is async. Poll the returned task_id until status is "completed".
- When done, read the audio URL from the response output.
curl -X POST https://runapi.ai/api/v1/elevenlabs/text_to_speech \
-H "Authorization: Bearer $RUNAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "text-to-speech-turbo-v2.5",
"text": "Welcome to RunAPI. This audio was generated by ElevenLabs turbo v2.5.",
"speed": 1.0,
"stability": 0.5,
"similarity_boost": 0.75
}'
{
"task_id": "tsk_abc123",
"status": "pending",
"model": "text-to-speech-turbo-v2.5"
}
Używaj ElevenLabs w OpenClaw w trzech krokach
Skonfiguruj RunAPI
Ustaw RUNAPI_API_KEY w swoim środowisku. Jeśli już skonfigurowałeś RunAPI do czatu w OpenClaw, ten sam klucz działa dla wszystkich endpointów ElevenLabs — TTS, STT, dialogue, efekty džwiękowe i izolacja džwięku.
export RUNAPI_API_KEY=runapi_xxx
Wywołaj text_to_speech
Wyślij POST do endpointu text_to_speech z modelem ustawionym na text-to-speech-turbo-v2.5, tekstem, który chcesz wypowiedzieć, oraz opcjonalnymi parametrami voice, speed i stability. Dla wyjścia wielojęzycznego użyj text-to-speech-multilingual-v2 z głosem i language_code.
POST /api/v1/elevenlabs/text_to_speech
Odpytuj o wynik
Endpoint natychmiast zwraca task_id. Odpytuj endpoint statusu zadania, aż status osiągnie wartość completed, a następnie odczytaj wyjściowy adres URL džwięku z odpowiedzi.
GET /api/v1/elevenlabs/text_to_speech/tsk_abc123
Parametry API ElevenLabs text_to_speech
| Parametr | Typ | Opis |
|---|---|---|
model |
string |
Wymagane. text-to-speech-turbo-v2.5 (niskie opóźnienie) lub text-to-speech-multilingual-v2 (29 języków). |
text |
string |
Wymagane. Tekst do przekonwertowania na mowę. Maksymalnie 5000 znaków. |
voice |
string |
ID głosu ElevenLabs. Wymagane dla multilingual-v2. Turbo-v2.5 używa domyślnego głosu, jeśli pominięto. |
speed |
float |
Opcjonalne. Mnożnik prędkości odtwarzania. Zakres 0.7 do 1.2. |
stability |
float |
Opcjonalne. Spójność głosu. Zakres 0.0 do 1.0. Niższe wartości dodają ekspresji. |
similarity_boost |
float |
Opcjonalne. Wymuszenie podobieństwa głosu. Zakres 0.0 do 1.0. |
style |
float |
Opcjonalne. Wzmocnienie stylu. Zakres 0.0 do 1.0. |
language_code |
string |
Opcjonalne. Docelowy język dla multilingual-v2, np. en, es, ja. |
callback_url |
string |
Opcjonalne. Adres URL webhooka, który otrzymuje POST po zakończeniu zadania. |
Czym jest ElevenLabs w OpenClaw?
ElevenLabs to popularne API tekst-do-mowy dla naturalnie brzmiącego wyjścia głosowego. Modele obsługują klonowalne głosy, wielojęzyczne wyjście w 29 językach i generowanie dźwięków. Agenty OpenClaw wywołują go przez RunAPI z tym samym kluczem API co do czatu.
Zastosowania ElevenLabs
Narracja audiobooków i podcastów
Konwertuj długie teksty na mówione audio ze spójnymi głosami postaci dla audiobooków i podcastów.
Dubbing wideo na wiele języków
Dubbinguj treści wideo na 29 języków z multilingual-v2 dla globalnej dystrybucji.
Efekty dźwiękowe dla produkcji wideo i gier
Generuj niestandardowe dźwięki Foley, audio otoczenia i sygnały dźwiękowe dla produkcji kreatywnych.
Pytania o ElevenLabs + OpenClaw
RunAPI udostępnia sześć endpointów ElevenLabs: text_to_speech (turbo-v2.5 i multilingual-v2), text_to_dialogue (dialogue-v3 dla wielu mówców), text_to_sound (efekty džwiękowe), speech_to_text (transkrypcja) i isolate_audio (ekstrakcja wokalu). Wszystkie korzystają z tego samego RUNAPI_API_KEY.
Turbo-v2.5 jest zoptymalizowany pod kątem niskich opóźnień i przede wszystkim angielskiego wyjścia — stosuje domyślny głos, gdy żaden nie jest podany. Multilingual-v2 obsługuje 29 języków i wymaga jawnego ID głosu oraz opcjonalnego language_code. Turbo kosztuje mniej więcej o połowę mniej za znak.
Asynchroniczny. Endpoint create zwraca task_id natychmiast. Odpytuj endpoint statusu zadania lub podaj callback_url, aby otrzymać webhook, gdy plik audio będzie gotowy do pobrania.
Endpointy text-to-speech i dialogue są rozliczane per znak tekstu wejściowego. Speech-to-text jest rozliczany per minuta džwięku. Izolacja džwięku jest rozliczana per zadanie. Sprawdź stronę cennika RunAPI, aby uzyskać aktualne stawki.
Tak. Wywołaj endpoint text_to_dialogue z modelem text-to-dialogue-v3. Przekaż tablicę dialogue, gdzie każdy element ma text i ID głosu. Łączna liczba znaków tekstu wszystkich mówców musi być mniejsza niż 5000 znaków.
Ogólna konfiguracja OpenClaw
Nie skonfigurowano jeszcze? Zacznij od przewodnika konfiguracji RunAPI dla OpenClaw.
Przewodnik konfiguracji OpenClaw →Katalog modeli ElevenLabs
Zobacz wszystkie warianty ElevenLabs, ceny i dokumentację API.
ElevenLabs na RunAPI →Wypróbuj ElevenLabs w OpenClaw już dziś.
Zdobądź darmowy klucz RunAPI, wklej prompt do OpenClaw i generuj džwięk mowy z ElevenLabs — sześć endpointów, jeden klucz API, rozliczenie per znak.