Jakich endpointów ElevenLabs mogę używać z OpenClaw?

RunAPI udostępnia sześć endpointów ElevenLabs: text_to_speech (turbo-v2.5 i multilingual-v2), text_to_dialogue (dialogue-v3 dla wielu mówców), text_to_sound (efekty džwiękowe), speech_to_text (transkrypcja) i isolate_audio (ekstrakcja wokalu). Wszystkie korzystają z tego samego RUNAPI_API_KEY.

Jaka jest różnica między turbo-v2.5 a multilingual-v2?

Turbo-v2.5 jest zoptymalizowany pod kątem niskich opóźnień i przede wszystkim angielskiego wyjścia — stosuje domyślny głos, gdy żaden nie jest podany. Multilingual-v2 obsługuje 29 języków i wymaga jawnego ID głosu oraz opcjonalnego language_code. Turbo kosztuje mniej więcej o połowę mniej za znak.

Czy TTS ElevenLabs jest synchroniczny czy asynchroniczny na RunAPI?

Asynchroniczny. Endpoint create zwraca task_id natychmiast. Odpytuj endpoint statusu zadania lub podaj callback_url, aby otrzymać webhook, gdy plik audio będzie gotowy do pobrania.

Jak rozliczany jest ElevenLabs na RunAPI?

Endpointy text-to-speech i dialogue są rozliczane per znak tekstu wejściowego. Speech-to-text jest rozliczany per minuta džwięku. Izolacja džwięku jest rozliczana per zadanie. Sprawdź stronę cennika RunAPI, aby uzyskać aktualne stawki.

Czy mogę używać ElevenLabs dialogue-v3 do džwięku wieloosobowego w OpenClaw?

Tak. Wywołaj endpoint text_to_dialogue z modelem text-to-dialogue-v3. Przekaż tablicę dialogue, gdzie każdy element ma text i ID głosu. Łączna liczba znaków tekstu wszystkich mówców musi być mniejsza niż 5000 znaków.

OPENCLAW + ELEVENLABS

Używaj ElevenLabs w OpenClaw.

ElevenLabs zapewnia sześć endpointów audio przez RunAPI — TTS turbo-v2.5 z opóźnieniem poniżej sekundy, multilingual-v2 obsługujący 29 języków, dialogue-v3 dla rozmów wieloosobowych, efekty džwiękowe, transkrypcję mowy na tekst i izolację wokalu. Agenty OpenClaw wywołują je tym samym kluczem RunAPI używanym do czatu.

Pobierz API Key Przeczytaj dokumentację

jeden klucz API · endpoint text to speech · rozliczenie per znak

Use RunAPI to generate speech audio with ElevenLabs text-to-speech.

Requirements:
- Read the API key from RUNAPI_API_KEY.
- Call POST https://runapi.ai/api/v1/elevenlabs/text_to_speech
- Set model to "text-to-speech-turbo-v2.5".
- Set text to the content you want spoken.
- Optionally set voice to a specific ElevenLabs voice ID.
- Optionally set speed between 0.7 and 1.2.
- The task is async. Poll the returned task_id until status is "completed".
- When done, read the audio URL from the response output.

curl -X POST https://runapi.ai/api/v1/elevenlabs/text_to_speech \
  -H "Authorization: Bearer $RUNAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "text-to-speech-turbo-v2.5",
    "text": "Welcome to RunAPI. This audio was generated by ElevenLabs turbo v2.5.",
    "speed": 1.0,
    "stability": 0.5,
    "similarity_boost": 0.75
  }'

{
  "task_id": "tsk_abc123",
  "status": "pending",
  "model": "text-to-speech-turbo-v2.5"
}

Skopiuj polecenie curl do testowania elevenlabs

JAK TO DZIAŁA

Używaj ElevenLabs w OpenClaw w trzech krokach

Skonfiguruj RunAPI

Ustaw RUNAPI_API_KEY w swoim środowisku. Jeśli już skonfigurowałeś RunAPI do czatu w OpenClaw, ten sam klucz działa dla wszystkich endpointów ElevenLabs — TTS, STT, dialogue, efekty džwiękowe i izolacja džwięku.

export RUNAPI_API_KEY=runapi_xxx

Wywołaj text_to_speech

Wyślij POST do endpointu text_to_speech z modelem ustawionym na text-to-speech-turbo-v2.5, tekstem, który chcesz wypowiedzieć, oraz opcjonalnymi parametrami voice, speed i stability. Dla wyjścia wielojęzycznego użyj text-to-speech-multilingual-v2 z głosem i language_code.

POST /api/v1/elevenlabs/text_to_speech

Odpytuj o wynik

Endpoint natychmiast zwraca task_id. Odpytuj endpoint statusu zadania, aż status osiągnie wartość completed, a następnie odczytaj wyjściowy adres URL džwięku z odpowiedzi.

GET /api/v1/elevenlabs/text_to_speech/tsk_abc123

PARAMETRY

Parametry API ElevenLabs text_to_speech

Parametr	Typ	Opis
`model`	`string`	Wymagane. text-to-speech-turbo-v2.5 (niskie opóźnienie) lub text-to-speech-multilingual-v2 (29 języków).
`text`	`string`	Wymagane. Tekst do przekonwertowania na mowę. Maksymalnie 5000 znaków.
`voice`	`string`	ID głosu ElevenLabs. Wymagane dla multilingual-v2. Turbo-v2.5 używa domyślnego głosu, jeśli pominięto.
`speed`	`float`	Opcjonalne. Mnożnik prędkości odtwarzania. Zakres 0.7 do 1.2.
`stability`	`float`	Opcjonalne. Spójność głosu. Zakres 0.0 do 1.0. Niższe wartości dodają ekspresji.
`similarity_boost`	`float`	Opcjonalne. Wymuszenie podobieństwa głosu. Zakres 0.0 do 1.0.
`style`	`float`	Opcjonalne. Wzmocnienie stylu. Zakres 0.0 do 1.0.
`language_code`	`string`	Opcjonalne. Docelowy język dla multilingual-v2, np. en, es, ja.
`callback_url`	`string`	Opcjonalne. Adres URL webhooka, który otrzymuje POST po zakończeniu zadania.

Czym jest ElevenLabs w OpenClaw?

ElevenLabs to popularne API tekst-do-mowy dla naturalnie brzmiącego wyjścia głosowego. Modele obsługują klonowalne głosy, wielojęzyczne wyjście w 29 językach i generowanie dźwięków. Agenty OpenClaw wywołują go przez RunAPI z tym samym kluczem API co do czatu.

Zastosowania ElevenLabs

Narracja audiobooków i podcastów

Konwertuj długie teksty na mówione audio ze spójnymi głosami postaci dla audiobooków i podcastów.

Dubbing wideo na wiele języków

Dubbinguj treści wideo na 29 języków z multilingual-v2 dla globalnej dystrybucji.

Efekty dźwiękowe dla produkcji wideo i gier

Generuj niestandardowe dźwięki Foley, audio otoczenia i sygnały dźwiękowe dla produkcji kreatywnych.

FAQ

Pytania o ElevenLabs + OpenClaw

Ogólna konfiguracja OpenClaw

Nie skonfigurowano jeszcze? Zacznij od przewodnika konfiguracji RunAPI dla OpenClaw.

Przewodnik konfiguracji OpenClaw →

Katalog modeli ElevenLabs

Zobacz wszystkie warianty ElevenLabs, ceny i dokumentację API.

ElevenLabs na RunAPI →

Wypróbuj ElevenLabs w OpenClaw już dziś.

Zdobądź darmowy klucz RunAPI, wklej prompt do OpenClaw i generuj džwięk mowy z ElevenLabs — sześć endpointów, jeden klucz API, rozliczenie per znak.

Przeglądaj modele →